用字系

用字系

[4] 自然言語表記に用いられる図形文字 (letter句読点など) の一式を書字体系書字用字系用字scriptwriting systemecriture などと呼びます。

[5] 書字体系は一般には言語と混同されがちです。たとえば、日本ではしばしばラテン文字のことを指して 「英語」といいます。しかしラテン文字を使って日本語を表記することもあり (ローマ字)、 厳密には書字体系言語とは区別されるべきものです。

用語

[8] この概念を表す用語は >>4 の通りいろいろあり、それぞれのニュアンスは使う人や文脈によって微妙に異なっています。

[6] 日本語の表記には平仮名片仮名漢字などの複数の文字集合を併用します。 書字体系用字系といった用語はこのそれぞれの文字集合を指して、あるいは全体を指して使われますが、 どちらかというと書字体系の方が全体を指すニュアンスがあるかもしれません。

[7] 書字体系というと単なる文字集合にとどまらず、 縦書き横書きの違いであったり、句読点の用法であったりを含むニュアンスで用いられることもあります。 前者は書字方向、後者は正書法などと呼ばれます。

[9] 書字体系という語はある言語の表記法というニュアンスが、 用字系という語は言語に関わらず一セットの文字の組というニュアンスがあるかもしれません。

ISO における用字の定義

[1]

用字 (script)
一つ以上の言語の表記の方法で使用する図形文字の集合。 (JIS X 0221‐1:2001 4.35)

[11] IETFISO/IEC 10646 の定義を採用しています >>10

[2]

A script is a set of graphic characters used for the written form of one or more languages.

[12] RFC 6365 - Terminology Used in Internationalization in the IETF ( 版) http://tools.ietf.org/html/rfc6365#section-2

[13] RFC 6365 - Terminology Used in Internationalization in the IETF ( 版) http://tools.ietf.org/html/rfc6365#page-6

用字系の識別

[14] 用字系を識別するものとしては、次の符号が定義されています。

用字系の分類

[18] UAX #31 では、現代における利用度によって用字系が3種類に分類されています。

色々な書字体系

[19]

[23] Unicode符号位置をいずれかの用字系に割り振っていますが、 複数の用字系で使われるものを Zyyy、 いずれの用字系にも属さないものを Zzzz としています。

[24] かつての Unicode平仮名片仮名、いくつかの仮名Hrkt に属するとしていましたが、現在 Hrkt空集合となっています。 Unicode で使われる用字系の値で空集合となっているのは Hrkt のみです。

書字方向

書字方向

関連

文字クラス

メモ

[20] RFC 5139 - Revised Civic Location Format for Presence Information Data Format Location Object (PIDF-LO) () https://tools.ietf.org/html/rfc5139#section-3.5

The "script" field defined in [RFC4776] is omitted in favor of using

the "xml:lang" attribute with a script subtag [RFC4646].

[21] RFC 4676 - Dynamic Host Configuration Protocol (DHCPv4 and DHCPv6) Option for Civic Addresses Configuration Information () https://tools.ietf.org/html/rfc4676#section-3.4

Script: The "script" item (CAtype 128) optionally identifies the

script used for presenting the address information, drawing from

the tags for identifying scripts described in [12] and elaborated

on in Section 2.2.3 of [13]. If omitted, the default value for

this tag is "Latn".

[22] RFC 4776 - Dynamic Host Configuration Protocol (DHCPv4 and DHCPv6) Option for Civic Addresses Configuration Information () https://tools.ietf.org/html/rfc4776#page-11

Script: The "script" item (CAtype 128) optionally identifies the

script used for presenting the address information, drawing from

the tags for identifying scripts described in [12] and elaborated

on in Section 2.2.3 of [13]. If omitted, the default value for

this tag is "Latn".

[25] UAX #44: Unicode Character Database, , https://www.unicode.org/reports/tr44/#Default_Values_Table