

[39] 正規表現 (regular expression) (正則表現) は、 正規言語を記述できる言語です。 ただし、通常用いられるものは文脈自由言語やそれ以上の言語を表現できるよう拡張されています。

[51] Unix の各種ツールや Perl などのプログラミング言語Emacs などのエディターなど、非常に多くのソフトウェアで採用されています。 ツールや言語によって様々な構文と意味のバリエーションがあり、 「正規表現」はそうした多数の言語の総称と言えます。


  1. 名称・略称
  2. 標準化
  3. 正規表現の多様性
  4. 構文
  5. 文脈
  6. 可視化
  7. 歴史
  8. メモ


[23] 正規表現 = Regular expression でして、その略称としては regex と regexp がともによく使われます。

[57] 正規言語 (正則言語) の表記法を指す時は、正則表現と呼ぶのが普通です。 正規表現と呼ぶ時のほとんどは、正則言語以上のものを表現できる拡張された表記法を指しています。


[8] 正規表現には色々なバリエーションがあり、正規表現一般の標準は存在しない状態です。 互いに矛盾する機能もあり、完全な標準化は今後もあり得ないと思われます。

[61] 90年代後半から00年代にかけては、 Perl正規表現の代表的な実装の1つであり、 活発に新機能を追加していました。 PCRE をはじめ他の色々な実装がこれに追随しており、 Perl正規表現事実上の標準の1つとみなされていました。 ただし完全な可搬性が実現されていたわけではなく、 任意の Perlコードを埋め込めるような機能のように Perl 以外では実装不能な部分すらあります。

[60] 正規表現仕様として標準化団体等が制定したものには、 次のものがあります。

[48] XQuery 1.0 and XPath 2.0 Functions and OperatorsXML Schema 1.0正規表現に多少の変更を加えています。
[49] C++ECMAScript正規表現に多少の変更を加えています >>47
[50] HTMLJavaScript (ECMAScript) を参照しており、 独自には定義していません。

[71] UTS #37 は、 Perl 5.8 正規表現を参照しています。

[80] Table Schema | Frictionless Standards, , https://specs.frictionlessdata.io/table-schema/#constraints

XML Schema 正規表現を採用。

[24] 正規表現の多様性#

[52] 正規表現は、その実装によって様々な構文や意味となっています。 あまりにも多種多様なバリエーションが存在するため、おそらくどの正規表現のバリエーションでも共通して使えるのは、 ASCIIラテン文字ASCII数字連接くらいでしょう。

