[1] コーパスのタグセット各種のいくつかの要素には
style
属性があります。
[4]
明六雑誌コーパス
の
article
の
style
では、
文語: 「文語体。文末辞が「なり」「たり」「つ」「ぬ」「き」「けり」のもの。」口語: 「口語体。文末辞が「だ」「ぢや」「である」「です」「ます」のもの。」混在: 「文語体と口語体が混在するもの。」です。 >>29 #page=6
[7]
国民之友コーパス
の
article
の
style
では、
文語: 「文語体。文末辞が「なり」「たり」「つ」「ぬ」「き」「けり」のもの。」口語: 「口語体。文末辞が「だ」「ぢや」「である」「です」「ます」のもの。」混在: 「文語体と口語体が混在するもの。」項目: 「文末辞がなく、文語体か口語体か定められないもの。」漢文: 「漢文。」外国語: 「外国語(漢文を除く)。」韻文: 「日本語による韻文。」万葉: 「万葉仮名を使用するもの。」です。 >>32 #page=12
[17] replacedBlock には type
属性がありますが、属性値が違います。