ABAP如何使用正则表达式

正则表达式的作用无外乎三种：验证（是否符合规则）、查找（包含提取）、替换，其中有两种方法来使用：
一、类方法：
CL_ABAP_REGEX regex就是regular expression的缩写，里面的方法不是很多，可能用到的也就只有构造方法和REATE_MATCHER这个方法。
CL_ABAP_MATCHER matcher匹配的意思，也就是说所有的匹配规则都和它有关，里面具体方法，se24去查看

1、验证

IF cl_abap_matcher=>matches( pattern = '\D+'
text = 'ZF25' ) = abap_true.
WRITE 'IS NUMBER'.
ELSE.
WRITE 'IS NOT NUMBER'.
ENDIF.

复制代码

输出结果：

IS NOT NUMBER

复制代码

解释：CL_ABAP_MATCHER有一个静态方法，直接进行匹配。

2、查找

DATA:matcher TYPE REF TO cl_abap_matcher,
matches TYPE match_result_tab,
match LIKE LINE OF matches,
w_text TYPE string.
w_text = '<a id="MyLinks1_NewPostLink"'
& ' href="http://www.sapclub.cc/VerySky/admin/EditPosts.aspx?opt=1">'.
matcher = cl_abap_matcher=>create( pattern = 'http://.*(?=")'
text = w_text ).
matches = matcher->find_all( ).
LOOP AT matches INTO match.
WRITE:/ w_text+match-offset(match-length).
ENDLOOP.

复制代码

输出结果：

http://www.sapclub.cc/VerySky/admin/EditPosts.aspx?opt=1

复制代码

解释：

创建match实例（创建规则），构造方法中有pattern参数输入规则，IGNORE_CASE是否忽略大小写，SIMPLE_REGEX是否使用简单规则（具体参见F1帮助文档），
在实例中有FIND_ALL(),FIND_NEXT()方法，可以用来查找。

这个方法是不是太麻烦了啊，不急有简单的方法，其实就是字符串处理中用到的。

DATA: patt TYPE string VALUE `n.?w`,
text TYPE string,
result_tab TYPE match_result_tab.
FIELD-SYMBOLS <match> LIKE LINE OF result_tab.
FIND ALL OCCURRENCES OF REGEX patt IN
`Everybody knows this is nowhere`
RESULTS result_tab.
LOOP AT result_tab ASSIGNING <match>.
WRITE: / <match>-offset, <match>-length.
ENDLOOP.

复制代码

输出结果：

11 3
24 3

复制代码

DATA: str TYPE string ,
result_tab TYPE match_result_tab ,
wa LIKE LINE OF result_tab.
*找出STRING里面的双字节字符
str = 'abc顾问adfsf大神'.
FIND ALL OCCURRENCES OF REGEX '[^\x00-\xff]*' IN str RESULTS result_tab.
LOOP AT result_tab INTO wa.
WRITE / str+wa-offset(wa-length).
ENDLOOP.

复制代码

输出结果：

顾问
大神

复制代码

解释：大家都知道英文字母是单字节的，中文是双字节的，但是在ABAP里面用strlen等方法是区别不出单双字节的，这个实例中讲的不失为一个很好的办法。

3、替换

DATA:matcher TYPE REF TO cl_abap_matcher,
count TYPE i,
w_text TYPE string,
w_newtext TYPE string.
w_text = 'hubinshishuibuzhidao'.
w_newtext = 'FFF'.
matcher = cl_abap_matcher=>create( pattern = 'sh.?i'
text = w_text ).
WRITE:/ 'REPLACE BEFORE:', w_text.
count = matcher->replace_all( newtext = w_newtext ).
WRITE:/ 'REPLACE COUNT IS:', count.
WRITE:/ 'REPLACE AFTER:', w_text.

复制代码

输出结果：

REPLACE BEFORE: hubinshishuibuzhidao
REPLACE COUNT IS: 2
REPLACE AFTER: hubinshishuibuzhidao

复制代码

大家肯定会说了，字符串前后没有没替换啊。注意修改的不是W_TEXT本身，他将修改后的值放到了MATCHER->TEXT即match类实例的属性里面，我们只需令W_TEXT = MATCHER->TEXT即可。

修改后：

DATA:matcher TYPE REF TO cl_abap_matcher,
count TYPE i,
w_text TYPE string,
w_newtext TYPE string.
w_text = 'hubinshishuibuzhidao'.
w_newtext = 'FFF'.
matcher = cl_abap_matcher=>create( pattern = 'sh.?i'
text = w_text ).
WRITE:/ 'REPLACE BEFORE:', w_text.
count = matcher->replace_all( newtext = w_newtext ).
w_text = matcher->text.
WRITE:/ 'REPLACE COUNT IS:', count.
WRITE:/ 'REPLACE AFTER:', w_text.

复制代码

输出结果：

REPLACE BEFORE: hubinshishuibuzhidao
REPLACE COUNT IS: 2
REPLACE AFTER: hubinFFFFFFbuzhidao

复制代码

二、字符串处理中的方法：

DATA text TYPE string VALUE '-dfufdud-'.
REPLACE ALL OCCURRENCES OF REGEX 'u' IN text WITH 'x'.
WRITE text.

复制代码

输出结果：

-dfxfdxd-

复制代码

学习，好久不用这东西了

[其他] ABAP如何使用正则表达式

相关帖子

Ta最近发表

快速回帖