corr
要素[1] コーパスのタグセット各種の
corr
要素は、
修正、校訂を表します。
[2]
誤植と思われる箇所は修正して corr
要素とします。
属性に原文の文字を示します。
>>29 #page=3, >>32 #page=8
[3]
漢文体・候文体は、
返読、補読、仮名開きをして corr
要素とします。
属性に原文の文字を示します。
>>32 #page=8
[5]
明六雑誌コーパス
では、
必須の
type
属性を、
とします。 >>29 #page=16
[11]
国民之友コーパス
では、
必須の
type
属性を、
erratum
: 「誤植の種類が誤字であることを表す。」excess
: 「誤植の種類が衍字であることを表す。」omission
: 「誤植の種類が脱字であることを表す。」返読前
: 「返読の対象となる文字の、訓読前の文字と位置を表す。」返読後
: 「返読の対象となる文字の、訓読後の文字と位置を表す。助動詞な補読
: 「補読された文字を表す。」仮名開き前
: 「返読は伴わないが仮名に開く対象となる文字の、開く前の文仮名開き後
: 「返読は伴わないが仮名に開く対象となる文字の、開いた後のとします。 >>32 #page=26
[9]
type
が
erratum
,
excess
,
返読前
,
仮名開き前
のとき、
originalText
属性に原文文字を示します。
>>29 #page=16, >>32 #page=26
[10]
ルビ文字列を訂正する場合、
ruby
や lRuby
の
rubyText
は訂正後のルビ文字列とします。
そしてそれを
corr
に入れます。
corr
の subType
属性を ruby
とします。
originalText
属性を訂正前のルビ文字列原文とします。
>>29 #page=16, >>32 #page=26
[20]
返読の前後、仮名開きの前後は対になっています。
id
属性が同じもので対になります。
属性値は XML文書内の固有のIDとされます。
>>32 #page=26
例文では数字列になっています。
[22]
明六雑誌コーパス
では漢文の書き下しを
corr
ではなく専用の
kanbun
要素で記述していました。
[23]
記述方法は要素名以外ほぼ同じです。
kanbun
要素の
type
には、
返読前
,
返読後
,
補読
を指定できます。
>>29 #page=19
correction
要素 (C-XML)[24] C-XML(文字ベースXMLデータ)詳細 現代日本語書き言葉均衡コーパス(BCCWJ), https://clrd.ninjal.ac.jp/bccwj/c-xml.html
correction タグ(誤植の修正した文字を表す)があります。
生活基<correction type="erratum" originalText="盟">盤</correction>に 伸びを示し<correction type="omission">てG lt;/correction>いる 整備を<correction type="excess" originalText="を" />図るべく