網(wǎng)站首頁編程語言正文

PostgreSQL模式匹配與正則表達(dá)式方法總結(jié)_PostgreSQL

作者：夢想家DBA ? 更新時間： 2022-12-14 編程語言

1.1 PostgreSQL中的模式匹配和正則表達(dá)式

PostgreSQL提供了以下3種實(shí)現(xiàn)模式匹配的方法：

·傳統(tǒng)SQL的LIKE操作符。
·SQL99標(biāo)準(zhǔn)新增的SIMILAR TO操作符。
·POSIX風(fēng)格的正則表達(dá)式。

另外，還有一個模式匹配函數(shù)substring可用，它可以使用SIMILAR TO風(fēng)格或者POSIX風(fēng)格的正則表達(dá)式。后面會詳細(xì)介紹substring函數(shù)的使用方法。

1.2 傳統(tǒng)SQL的LIKE操作符

傳統(tǒng)的LIKE操作符比較簡單，其中百分號“%”代表0個或任意個字符，而下劃線“_”代表任意一個字符，示例如下：

maxwelldb=# select * from mytab3;
 id |   note   
----+----------
  1 | abcabefg
  2 | abxyz
  3 | 123abc
  4 | ab_abefg
  5 | ab%abefg
  6 | ababefg
(6 rows)
 
maxwelldb=# select * from mytab3 where note like 'ab_ab%';
 id |   note   
----+----------
  1 | abcabefg
  4 | ab_abefg
  5 | ab%abefg
(3 rows)
 
maxwelldb=# select * from mytab3 where note like 'ab%ab%';
 id |   note   
----+----------
  1 | abcabefg
  4 | ab_abefg
  5 | ab%abefg
  6 | ababefg
(4 rows)

如果想匹配字符串中的百分號“%”自身或下劃線“_”自身怎么辦呢？可以在字符串前加轉(zhuǎn)義字符反斜杠“\”，示例如下：

maxwelldb=# select * from mytab3 where note like '%\%%';
 id |   note   
----+----------
  5 | ab%abefg
(1 row)
 
maxwelldb=# select * from mytab3 where note like '%\_%';
 id |   note   
----+----------
  4 | ab_abefg
(1 row)

轉(zhuǎn)義字符也可以通過ESCAPE子句指定為其他字符，如指定成“#”，命令如下：

maxwelldb=# select * from mytab3 where note like '%#%%' escape '#';
 id |   note   
----+----------
  5 | ab%abefg
(1 row)
 
maxwelldb=# select * from mytab3 where note like '%#_%' escape '#';
 id |   note   
----+----------
  4 | ab_abefg
(1 row)
 
maxwelldb=#

轉(zhuǎn)義字符本身可以通過使用連續(xù)兩個轉(zhuǎn)義字符去除轉(zhuǎn)義字符的特殊意義，示例如下：

maxwelldb=# insert into mytab3 value3(7,'\');
ERROR:  syntax error at or near "value3"
LINE 1: insert into mytab3 value3(7,'\');
                           ^
maxwelldb=# insert into mytab3 values(7,'\');
INSERT 0 1
maxwelldb=# insert into mytab3 values(8,'#');
INSERT 0 1
maxwelldb=# select * from mytab3 where note like '%\\%';
 id | note 
----+------
  7 | \
(1 row)
 
maxwelldb=# select * from mytab3 where note like '%##%' escape '#';
 id | note 
----+------
  8 | #
(1 row)

PostgreSQL還提供了標(biāo)準(zhǔn)SQL中沒有的ILIKE操作符，用于忽略大小寫的模式匹配。

PostgreSQL還提供了如下與LIKE等價的操作符。

·~~：等效于LIKE。

·~~*：等效于ILIKE。

·!~~：等效于NOT LIKE。

·!~~*：操作符NOT ILIKE。

1.3 SIMILAR TO正則表達(dá)式

SIMILAR TO是SQL99標(biāo)準(zhǔn)定義的正則表達(dá)式。SQL標(biāo)準(zhǔn)的正則表達(dá)式是混合了LIKE和普通的正則表達(dá)式的一個雜合體。

SIMILAR TO操作符只有匹配整個字符串時才能匹配成功，這一點(diǎn)與LIKE相同，而與普通的正則表達(dá)式只匹配部分的習(xí)慣不同。SIMILAR TO與LIKE一樣也使用下劃線和百分號分別匹配單個字符和任意字符串。

除了從LIKE借用的這些功能之外，SIMILAR TO還支持以下幾個與POSIX正則表達(dá)式相同的模式匹配元字符。

·|：表示選擇兩個候選項(xiàng)之一。

·*：表示重復(fù)前面的項(xiàng)0次或更多次。

·+：表示重復(fù)前面的項(xiàng)一次或更多次。

·?：表示重復(fù)前面的項(xiàng)0次或一次。

·{m}：表示重復(fù)前面的項(xiàng)m次。

·{m，}：表示重復(fù)前面的項(xiàng)m次或更多次。

·{m，n}：表示重復(fù)前面的項(xiàng)至少m次，不超過n次。

·括號()：可以作為項(xiàng)目分組到一個獨(dú)立的邏輯項(xiàng)。

·[...]：聲明一個字符類，就像POSIX正則表達(dá)式。

在SIMILAR TO中英文的句號“.”并不是元字符。和LIKE操作符一樣，可以使用反斜杠關(guān)閉這些元字符所有的特殊含義，當(dāng)然也可以用ESCAPE聲明另外一個轉(zhuǎn)義字符。

maxwelldb=# select 'osdba' SIMILAR TO 'a';
 ?column? 
----------
 f
(1 row)
 
maxwelldb=# select 'osdba' SIMILAR TO '%(b|a)';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'osdb' SIMILAR TO '%(s|d)%';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=#

1.4 POSIX正則表達(dá)式

POSIX正則表達(dá)式的模式匹配操作符有以下幾個。

·~：匹配正則表達(dá)式，區(qū)分大小寫。

·~*：匹配正則表達(dá)式，不區(qū)分大小寫。

·!~：不匹配正則表達(dá)式，區(qū)分大小寫。

·!~*：不匹配正則表達(dá)式，不區(qū)分大小寫。

POSIX正則表達(dá)式提供了比LIKE和SIMILAR TO操作符更強(qiáng)大的模式匹配方法。許多UNIX的命令如egrep、sed、awk都使用類似的模式匹配語言。

maxwelldb=# 
maxwelldb=# select 'osdba' ~ 'a';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'osdba' ~ '(b|a)*';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'osdb' ~ '.*(b|a).*';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'osdba' ~ '(s|d).*';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=#

在POSIX正則表達(dá)式中，百分號與下劃線沒有像LIKE或SIMILAR TO操作符中的特殊意義，示例如下：

 maxwelldb=# select 'osdba' ~ '%';
 ?column? 
----------
 f
(1 row)
 
maxwelldb=# select 'osdba' ~ '_sdba';
 ?column? 
----------
 f
(1 row)
 
maxwelldb=#

在POSIX正則表達(dá)式中與SIMILAR TO和LIKE操作符不一樣的是，只要部分匹配到字符串就返回真，這與UNIX中的grep命令是一樣的。

maxwelldb=# select 'osdba' ~ 'os';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=#

如果想匹配開頭或結(jié)尾，需要使用POSIX中的“^”或“$”元字符，示例如下：

maxwelldb=# select 'aosdba' ~ 'os';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'aosdba' ~ '^os';
 ?column? 
----------
 f
(1 row)
 
maxwelldb=# select 'osdba' ~ 'db';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'osdba' ~ 'db$';
 ?column? 
----------
 f
(1 row)
 
maxwelldb=# select 'osdba' ~ 'dba$';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=#

1.5 模式匹配函數(shù)substring

PostgreSQL中有一個很強(qiáng)大的函數(shù)substring，該函數(shù)可以使用正則表達(dá)式。substring有以下3種用法。

第一種：substring（<字符串>,<數(shù)字>,[數(shù)字]）。

后兩個參數(shù)為數(shù)字，該函數(shù)和其他語言中的substr函數(shù)的含義相同，示例如下。

maxwelldb=# select substring('osdba',2);
 substring 
-----------
 sdba
(1 row)
 
maxwelldb=#

第二種：substring（<字符串>,<字符串>）。

有兩個參數(shù)且都是字符串，這是一種使用POSIX正則表達(dá)式的方式。

前面說過，在PostgreSQL中有兩種正則表達(dá)式，一種被稱為SQL正則表達(dá)式；另一種被稱為POSIX正則表達(dá)式。POSIX正則表達(dá)式就是一般在腳本語言中使用的標(biāo)準(zhǔn)正則表達(dá)式，而SQL正則表達(dá)式首先是遵循SQL語句中的LIKE語法的，如字符“.”在POSIX正則表達(dá)式中代表任意字符，而在SQL表達(dá)式中就只能表示自己，表示任意字符的元字符是“_”。

SQL正則表達(dá)式中“%”可以表示任意個字符，而這在POSIX正則表達(dá)式中要用“.*”來表示。

同時SQL正則表達(dá)式也支持以下語法。

·|：表示選擇（兩個候選之一），這在POSIX正則表達(dá)式中不支持。

·*：表示重復(fù)前面的項(xiàng)0次或更多次。

·+：表示重復(fù)前面的項(xiàng)一次或更多次。

·()：把項(xiàng)組合成一個邏輯項(xiàng)。

·[...]：聲明一個字符類。

SIMILAR TO中使用的就是SQL正則表達(dá)式，而“~”使用的是POSIX正則表達(dá)式，注意兩者間的如下區(qū)別：

maxwelldb=# select 'osdba' ~ 'sdb';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=# select 'osdba' similar to 'sdb';
 ?column? 
----------
 f
(1 row)
 
maxwelldb=# select 'osdba' similar to '%sdb%';
 ?column? 
----------
 t
(1 row)
 
maxwelldb=#

從上面的示例中可以看出，SQL正則表達(dá)式要求全部匹配才為真，而POSIX表達(dá)式中只要包含就為真。

只有兩個參數(shù)的substring中的正則表達(dá)式是POSIX正則表達(dá)式，而不是SQL正則表達(dá)式，示例如下：

maxwelldb=# select substring('osdba-5-osdba',E'(\\d+)');
 substring 
-----------
 5
(1 row)
 
maxwelldb=#

這種方式的substring函數(shù)返回正則表達(dá)式中“()”中匹配的部分。

第三種：substring（<字符串>,<字符串>,<字符串）或substring（<字符串> from <字符串> for <字符串）。

這種形式的substring使用SQL正則表達(dá)式，第三個參數(shù)為指定一個轉(zhuǎn)義字符。示例如下：

maxwelldb=# select substring('osdba-5-osdba','%#"[0-9]+#"%','#');
 substring 
-----------
 5
(1 row)
 
maxwelldb=#

總結(jié)

原文鏈接：https://blog.csdn.net/u011868279/article/details/126619506

日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

網(wǎng)站首頁編程語言正文

PostgreSQL模式匹配與正則表達(dá)式方法總結(jié)_PostgreSQL

目錄

1.1 PostgreSQL中的模式匹配和正則表達(dá)式

1.2 傳統(tǒng)SQL的LIKE操作符

1.3 SIMILAR TO正則表達(dá)式

1.4 POSIX正則表達(dá)式

1.5 模式匹配函數(shù)substring

總結(jié)

相關(guān)推薦

日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

網(wǎng)站首頁 編程語言 正文

PostgreSQL模式匹配與正則表達(dá)式方法總結(jié)_PostgreSQL

目錄

1.1 PostgreSQL中的模式匹配和正則表達(dá)式

1.2 傳統(tǒng)SQL的LIKE操作符

1.3 SIMILAR TO正則表達(dá)式

1.4 POSIX正則表達(dá)式

1.5 模式匹配函數(shù)substring

總結(jié)

相關(guān)推薦

網(wǎng)站首頁編程語言正文