[1] [[コーパスのタグセット]]各種のいくつかの[[要素]]には
[DFN[[CODE[script]]]]
[[属性]]があります。

-*-*-

[4] 
[CITE[明六雑誌コーパス]]
の
[CODE[article]]
の
[CODE[script]]
では、

- [5] [DFN[[CODE[漢字カタカナ]]]]: [[漢字片仮名交じり]]
- [6] [DFN[[CODE[漢字ひらがな]]]]: [[漢字平仮名交じり]]

です。 [SRC[>>29 #page=6]]


[7] 
[CITE[国民之友コーパス]]
の
[CODE[article]]
の
[CODE[script]]
では、

- [8] [DFN[[CODE[カタカナ]]]]: [[漢字片仮名交じり]]
- [9] [DFN[[CODE[ひらがな]]]]: [[漢字平仮名交じり]]

です。
[SRC[>>32 #page=12]]

[10] 他のいくつかの[[要素]]でも同様に使えるとされます。


-*-*-

[2] 
原文が[[片仮名漢字混じり文]]で[[コーパス]]で[[平仮名仮名漢字混じり文]]に置き換えた時、
[CODE[script]] [[属性]]に[DFN[[CODE[カタカナ]]]]と記述します。
[SRC[>>32 #page=7]]

[3] 
また、原文のまま[[片仮名]]で残した[[文字列]]には、 
[CODE[span]] [[要素]]を使います。
[SRC[>>32 #page=7]]
[DFN[[CODE[type]]]]
[[属性]]を[DFN[[CODE[カタカナ]]]]とします。
[SRC[>>29 #page=12, >>32 #page=20]]

;; [12] [CODE[<span script>]] と [CODE[<span type>]] の違いに注意。
原文が[[片仮名漢字混じり文]]だと [CODE[<span script>]] を[CODE[カタカナ]]にし、
[[内容]]は[[平仮名]]にします。



[REFS[

- [29] [CITE[[L[『明六雑誌コーパス』の仕様]]]],
[[近藤明日子]],
[[田中牧郎]],
[TIME[2023-11-26T08:07:49.000Z]] <https://web.archive.org/web/20171116111759/http://pj.ninjal.ac.jp/corpus_center/cmj/doc/07kondo.pdf>
- [31] [CITE@ja[国立国語研究所学術情報リポジトリ]], [TIME[2023-11-26T08:12:17.000Z]] <https://repository.ninjal.ac.jp/records/3302>
-- [32] 
[CITE[[L[『国民之友コーパス』解説書[BR[]]第1.1 版]]]],
[[[L[近藤明日子]]]],
[[[L[2014]]]],
[CODE[kokumin_manual_v1_1.pdf]]

]REFS]

[11] 関連: [[style (コーパス)]]