[1] [[コーパスのタグセット]]各種の 
[DFN[[CODE[gap]]]] [[要素]]は[[判読不明]]箇所を、
[DFN[[CODE[unclear]]]] [[要素]]は不鮮明箇所を表します。


[3] 
文字の形が推測できる場合は [CODE[unclear]] を使います。
[SRC[>>29 #page=3, >>32 #page=8]]

[2] 
判読不能で文字の形が残らない場合は、
[CODE[gap]] [[要素]]を使う場合
[SRC[>>29 #page=3]]
と、
[[文字]]
[[␣]]
に[[翻刻]]して[[要素]]を使わないケースもあります。
[SRC[>>32 #page=8]]

[4] 
[CODE[gap]] [[要素]]の 
[DFN[[CODE[quantity]]]]
[[属性]]は[[文字]]数がわかれば書きます。
[SRC[>>29 #page=13]]

[5] 
[[ルビ文字列]]に不鮮明部分が含まれるときは、
[CODE[ruby][ruby (コーパス)]] や [CODE[lRuby]]
の [CODE[rubyText]] に推測後の[[ルビ文字列]]を指定します。
そしてその[[要素]]を
[CODE[unclear]] [[要素]]に入れます。
[CODE[unclear]] の 
[DFN[[CODE[originalText]]]]
[[属性]]を原文の[[ルビ文字列]]とします。
[SRC[>>17 #page=3, >>32 #page=28]]

[6] その場合は [CODE[originalText]] 中の不鮮明文字を
[DFN[[CODE[□]]]]
[SRC[>>17 #page=3]]
や
[DFN[[CODE[␣]]]]
[SRC[>>32 #page=28]]
で表します。

[7] また、
[DFN[[CODE[type]]]] [[属性]]は [DFN[[CODE[ruby]]]] とします。
[SRC[>>17 #page=3, >>32 #page=28]]




[REFS[

- [29] [CITE[[L[『明六雑誌コーパス』の仕様]]]],
[[近藤明日子]],
[[田中牧郎]],
[TIME[2023-11-26T08:07:49.000Z]] <https://web.archive.org/web/20171116111759/http://pj.ninjal.ac.jp/corpus_center/cmj/doc/07kondo.pdf>
- [31] [CITE@ja[国立国語研究所学術情報リポジトリ]], [TIME[2023-11-26T08:12:17.000Z]] <https://repository.ninjal.ac.jp/records/3302>
-- [32] 
[CITE[[L[『国民之友コーパス』解説書[BR[]]第1.1 版]]]],
[[[L[近藤明日子]]]],
[[[L[2014]]]],
[CODE[kokumin_manual_v1_1.pdf]]

]REFS]

