[1] コーパスのタグセット各種のいくつかの要素には
script
属性があります。
[4]
明六雑誌コーパス
の
article
の
script
では、
です。 >>29 #page=6
[7]
国民之友コーパス
の
article
の
script
では、
です。 >>32 #page=12
[2]
原文が片仮名漢字混じり文でコーパスで平仮名仮名漢字混じり文に置き換えた時、
script
属性にカタカナ
と記述します。
>>32 #page=7
[3]
また、原文のまま片仮名で残した文字列には、
span
要素を使います。
>>32 #page=7
type
属性をカタカナ
とします。
>>29 #page=12, >>32 #page=20
[11] 関連: style (コーパス)
<span script>
と<span type>
の違いに注意。 原文が片仮名漢字混じり文だと<span script>
をカタカナ
にし、 内容は平仮名にします。