[1] コーパスのタグセット各種の
s
要素や
superS
要素は、
文を表します。
[2]
s
要素は文を表します。
>>29 #page=10, >>32 #page=17
[3]
warigaki
や quotation
とその前後は別の s
にする制約があります。
その場合分割されて生じた細かい方の s
は
type
属性を fragment
とします。
s
や割書、引用などを含む文の全体は
superS
要素とします。
>>29 #page=10, >>32 #page=17
[7]
M-XML
には
sentence
と
superSentence
があります。
[6] M-XML(統合形式XMLデータ)詳細 現代日本語書き言葉均衡コーパス(BCCWJ), https://clrd.ninjal.ac.jp/bccwj/m-xml.html