[1] [[コーパスのタグセット]]各種の 
[DFN[[CODE[ruby]]]] [[要素]]や
[DFN[[CODE[lRuby]]]] [[要素]]は、
[[ルビ]]を表します。

[2] 
[CODE[ruby]] は、
[[右ルビ]]を表します。
[SRC[>>29 #page=15, >>32 #page=24]]

[3] 
[CODE[lRuby]] は、
[[左ルビ]]を表します。
[SRC[>>29 #page=15, >>32 #page=24]]

[4] 
[[ルビ文字列]]は[[必須]]の [DFN[[CODE[rubyText]]]] [[属性]]に書きます。
[SRC[>>29 #page=15, >>32 #page=24]]


[5] 
[[ルビ基底]]は[[要素]]の[[内容]]によります。
ただし複数の [CODE[SUW]] [[要素]]で構成される[[文字列]]に対して1つの[[ルビ]]となる場合は、
[CODE[ruby]] [[要素]]の範囲は先頭の[[短単位]]のみとし、
[DFN[[CODE[rubyBase]]]] [[属性値]]にそれを含む[[ルビ基底]]の全体を指定します。
[SRC[>>29 #page=15, >>32 #page=24]]

[6] 
[CODE[ruby]] は [DFN[[CODE[r]]]] [[要素]]と同義です。
>>29 #page=15 には[[開始タグ]]が [CODE[ruby]],
[[終了タグ]]が [CODE[r]]
の例文がありますが、
[[誤植]]なのか、
実際に[[コーパス]]に出現することがあるのかはわかりません。

[7] 
[[ルビ文字列]]に[[誤植]]や推定や[[濁音]]補正があるときは、訂正後の値とし、
[CODE[corr]] や [CODE[unclear]] や [CODE[vMark]] を併用します。
[SEE[ [[corr]], [CODE[unclear]], [CODE[vMark]] ]]

[8] 
[[属性値]]に構造を入れられないという制約と[[ルビ文字列]]に[[属性値]]を使うという選択 (ほとんどの場合の簡潔さを優先した?) のため、
[[ルビ文字列]]に注釈を加えたい時にややこしいことになっています。


[REFS[

- [29] [CITE[[L[『明六雑誌コーパス』の仕様]]]],
[[近藤明日子]],
[[田中牧郎]],
[TIME[2023-11-26T08:07:49.000Z]] <https://web.archive.org/web/20171116111759/http://pj.ninjal.ac.jp/corpus_center/cmj/doc/07kondo.pdf>
- [31] [CITE@ja[国立国語研究所学術情報リポジトリ]], [TIME[2023-11-26T08:12:17.000Z]] <https://repository.ninjal.ac.jp/records/3302>
-- [32] 
[CITE[[L[『国民之友コーパス』解説書[BR[]]第1.1 版]]]],
[[[L[近藤明日子]]]],
[[[L[2014]]]],
[CODE[kokumin_manual_v1_1.pdf]]

]REFS]



[9] [CITE@ja[[[C-XML]](文字ベースXMLデータ)詳細 現代日本語書き言葉均衡コーパス(BCCWJ)]], [TIME[2023-12-02T04:42:23.000Z]] <https://clrd.ninjal.ac.jp/bccwj/c-xml.html>

>
[EG[
[PRE[
<ruby rubyText="ご">語</ruby><ruby rubyText="い">彙</ruby>
]PRE]
]EG]

[10] [CITE@ja[[[M-XML]](統合形式XMLデータ)詳細 現代日本語書き言葉均衡コーパス(BCCWJ)]], [TIME[2023-12-02T06:38:35.000Z]] <https://clrd.ninjal.ac.jp/bccwj/m-xml.html>
