[1] コーパスのタグセット各種のいくつかの要素には
style
属性があります。
[4]
明六雑誌コーパス
の
article
の
style
では、
文語
: 「文語体。文末辞が「なり」「たり」「つ」「ぬ」「き」「けり」のもの。」口語
: 「口語体。文末辞が「だ」「ぢや」「である」「です」「ます」のもの。」混在
: 「文語体と口語体が混在するもの。」です。 >>29 #page=6
[7]
国民之友コーパス
の
article
の
style
では、
文語
: 「文語体。文末辞が「なり」「たり」「つ」「ぬ」「き」「けり」のもの。」口語
: 「口語体。文末辞が「だ」「ぢや」「である」「です」「ます」のもの。」混在
: 「文語体と口語体が混在するもの。」項目
: 「文末辞がなく、文語体か口語体か定められないもの。」漢文
: 「漢文。」外国語
: 「外国語(漢文を除く)。」韻文
: 「日本語による韻文。」万葉
: 「万葉仮名を使用するもの。」です。 >>32 #page=12
[17] replacedBlock
には type
属性がありますが、属性値が違います。