<html xmlns="http://www.w3.org/1999/xhtml"><head></head><body><section><h1><code>corr</code> 要素</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="1" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[1]</anchor-end> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">コーパスのタグセット</anchor>各種の 
<dfn><code>corr</code></dfn> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">要素</anchor>は、
修正、<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">校訂</anchor>を表します。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="2" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[2]</anchor-end> 
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">誤植</anchor>と思われる箇所は修正して <code>corr</code> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">要素</anchor>とします。
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">属性</anchor>に原文の文字を示します。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="29" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;29</anchor-internal> #page=3, <anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="32" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;32</anchor-internal> #page=8</src></p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="3" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[3]</anchor-end> 
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">漢文体</anchor>・<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">候文体</anchor>は、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">返読</anchor>、<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">補読</anchor>、<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">仮名開き</anchor>をして <code>corr</code> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">要素</anchor>とします。
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">属性</anchor>に原文の文字を示します。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="32" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;32</anchor-internal> #page=8</src></p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="5" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[5]</anchor-end> 
<cite>明六雑誌コーパス</cite>
では、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">必須</anchor>の
<dfn><code>type</code></dfn>
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">属性</anchor>を、</p><ul><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="6" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[6]</anchor-end> <dfn><code>erratum</code></dfn>: 「誤字」</li><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="7" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[7]</anchor-end> <dfn><code>excess</code></dfn>: 「衍字」</li><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="8" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[8]</anchor-end> <dfn><code>omission</code></dfn>: 「脱字」</li></ul><p>とします。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="29" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;29</anchor-internal> #page=16</src></p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="11" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[11]</anchor-end> 
<cite>国民之友コーパス</cite>
では、
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">必須</anchor>の
<dfn><code>type</code></dfn>
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">属性</anchor>を、</p><ul><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="12" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[12]</anchor-end> <dfn><code>erratum</code></dfn>: 「誤植の種類が誤字であることを表す。」</li><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="13" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[13]</anchor-end> <dfn><code>excess</code></dfn>: 「誤植の種類が衍字であることを表す。」</li><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="14" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[14]</anchor-end> <dfn><code>omission</code></dfn>: 「誤植の種類が脱字であることを表す。」</li><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="15" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[15]</anchor-end> <dfn><code>返読前</code></dfn>: 「返読の対象となる文字の、訓読前の文字と位置を表す。」</li><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="16" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[16]</anchor-end> <dfn><code>返読後</code></dfn>: 「返読の対象となる文字の、訓読後の文字と位置を表す。助動詞な<sw-br xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:"></sw-br>どは仮名に開いてテキスト化する。」</li><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="17" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[17]</anchor-end> <dfn><code>補読</code></dfn>: 「補読された文字を表す。」</li><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="18" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[18]</anchor-end> <dfn><code>仮名開き前</code></dfn>: 「返読は伴わないが仮名に開く対象となる文字の、開く前の文<sw-br xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:"></sw-br>字と位置を表す」</li><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="19" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[19]</anchor-end> <dfn><code>仮名開き後</code></dfn>: 「返読は伴わないが仮名に開く対象となる文字の、開いた後の<sw-br xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:"></sw-br>文字と位置を表す」</li></ul><p>とします。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="32" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;32</anchor-internal> #page=26</src></p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="9" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[9]</anchor-end> 
<code>type</code>
が
<code>erratum</code>,
<code>excess</code>,
<code>返読前</code>,
<code>仮名開き前</code>
のとき、
<dfn><code>originalText</code></dfn>
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">属性</anchor>に原文文字を示します。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="29" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;29</anchor-internal> #page=16, <anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="32" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;32</anchor-internal> #page=26</src></p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="10" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[10]</anchor-end> 
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">ルビ文字列</anchor>を訂正する場合、
<code>ruby<title xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:">ruby (コーパス)</title></code> や <code>lRuby</code>
の 
<code>rubyText</code>
は訂正後の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">ルビ文字列</anchor>とします。
そしてそれを
<code>corr</code>
に入れます。
<code>corr</code> の <dfn><code>subType</code></dfn>
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">属性</anchor>を <dfn><code>ruby</code></dfn>
とします。
<code>originalText</code> <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">属性</anchor>を訂正前の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">ルビ文字列</anchor>原文とします。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="29" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;29</anchor-internal> #page=16, <anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="32" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;32</anchor-internal> #page=26</src></p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="20" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[20]</anchor-end> 
返読の前後、仮名開きの前後は対になっています。
<dfn><code>id</code></dfn>
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">属性</anchor>が同じもので対になります。
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">属性値</anchor>は <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">XML文書</anchor>内の固有のIDとされます。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="32" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;32</anchor-internal> #page=26</src>
例文では<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">数字列</anchor>になっています。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="21" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[21]</anchor-end> 
前は<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">空要素</anchor>にし、後は変更後のものを<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">内容</anchor>にします。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="22" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[22]</anchor-end> 
<cite>明六雑誌コーパス</cite>
では<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">漢文</anchor>の<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">書き下し<title xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:">書き下し文</title></anchor>を
<code>corr</code>
ではなく専用の
<dfn><code>kanbun</code></dfn>
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">要素</anchor>で記述していました。</p><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="23" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[23]</anchor-end>
記述方法は<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">要素名</anchor>以外ほぼ同じです。
<code>kanbun</code>
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">要素</anchor>の
<dfn><code>type</code></dfn>
には、
<code>返読前</code>,
<code>返読後</code>,
<code>補読</code>
を指定できます。
<src xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:10:"><anchor-internal xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="29" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">&gt;&gt;29</anchor-internal> #page=19</src></p><refs xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:"><ul xmlns="http://www.w3.org/1999/xhtml"><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="29" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[29]</anchor-end> <cite><sw-l xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">『明六雑誌コーパス』の仕様</sw-l></cite>,
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">近藤明日子</anchor>,
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">田中牧郎</anchor>,
<time>2023-11-26T08:07:49.000Z</time> <anchor-external xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resScheme="URI" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resParameter="https://web.archive.org/web/20171116111759/http://pj.ninjal.ac.jp/corpus_center/cmj/doc/07kondo.pdf">https://web.archive.org/web/20171116111759/http://pj.ninjal.ac.jp/corpus_center/cmj/doc/07kondo.pdf</anchor-external></li><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="31" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[31]</anchor-end> <cite xml:lang="ja">国立国語研究所学術情報リポジトリ</cite>, <time>2023-11-26T08:12:17.000Z</time> <anchor-external xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resScheme="URI" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resParameter="https://repository.ninjal.ac.jp/records/3302">https://repository.ninjal.ac.jp/records/3302</anchor-external><ul><li><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="32" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[32]</anchor-end> 
<cite><sw-l xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">『国民之友コーパス』解説書<sw-br></sw-br>第1.1 版</sw-l></cite>,
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:"><sw-l>近藤明日子</sw-l></anchor>,
<anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:"><sw-l>2014</sw-l></anchor>,
<code>kokumin_manual_v1_1.pdf</code></li></ul></li></ul></refs></section><section><h1><code>correction</code> 要素 (C-XML)</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="24" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[24]</anchor-end> <cite xml:lang="ja"><anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">C-XML</anchor>(文字ベースXMLデータ)詳細 現代日本語書き言葉均衡コーパス(BCCWJ)</cite>, <time>2023-12-02T04:40:25.000Z</time> <anchor-external xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resScheme="URI" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:resParameter="https://clrd.ninjal.ac.jp/bccwj/c-xml.html">https://clrd.ninjal.ac.jp/bccwj/c-xml.html</anchor-external></p><blockquote><p><snip xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:"></snip>correction タグ(誤植の修正した文字を表す)があります。<example xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:"><pre xmlns="http://www.w3.org/1999/xhtml">生活基&lt;correction type=&quot;erratum&quot; originalText=&quot;盟&quot;&gt;盤&lt;/correction&gt;に
伸びを示し&lt;correction type=&quot;omission&quot;&gt;て<asis xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">G</asis>lt;/correction&gt;いる
整備を&lt;correction type=&quot;excess&quot; originalText=&quot;を&quot; /&gt;図るべく</pre></example></p></blockquote></section><section><h1>関連</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="4" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[4]</anchor-end> 関連: <code>gap</code>, <code>unclear</code></p></section><section><h1>メモ</h1></section></body></html>