* 関連

[27] [[媒体要素]]、[CODE[vibrate]] も参照。

* 歴史

[2] [[Web]] による音声入出力には長い歴史がありますが、未だ成熟していません。

** HTML

[15] [[Netscape]] は [CODE(HTMLe)@en[[[embed]]]] により間接的に音声出力に対応しました。

[14] [[IE]] は [CODE(HTMLe)@en[[[bgsound]]]], [CODE(HTML)@en[<[[img]] [[dynsrc]]>]]
により音声出力に対応しました。後に [CODE(HTMLe)@en[[[object]]]] により間接的に対応し、
こちらが主流となりました。

[16] その後しばらく音声機能が直接 [[Webブラウザー]]で実装されることはありませんでした。

[20] [[device-upload]] は[[フォーム]]の音声入力機能を提案しましたが、実装されませんでした。

[21] [[ガラケー]]用の [[Webブラウザー]]は、 [CODE(HTMLe)@en[[[object]]]]
[[要素]]などを使って独自の音声再生機能を実装していました。

** CSS

[10] [[CSS 2.0]] は[[媒体型]] [CODE(CSS)@en[[[aural]]]]
と関連する[[特性]]を規定していました。 [[Emacs/W3]] + [[Emacspeak]]
の実装に基づいていました。

[11] [[CSS 2.1]] と [[CSS3]] は[[媒体型]] [CODE(CSS)@en[[[speech]]]] に置き換えるとともに、
複数の実装が無いとして、関連する[[特性]]を[[規定]]から[[参考]]/[[CR]]
レベルに格下げしました。

[7] [CITE[BEP and Emacs-W3]] <http://www.argv.org/bep/doc/jarvi10/bep.html#w3-demo>

例文 & レンダリング例あり。

[FIG(quote)[
[FIGCAPTION[
[25] [CITE@en[Speech Synthesis Markup Language (SSML) Version 1.1]] ([TIME[2010-09-08 00:26:19 +09:00]] 版) <http://www.w3.org/TR/2010/REC-speech-synthesis11-20100907/#S2.3.2>
]FIGCAPTION]

>Aural Cascading Style Sheets [CSS2  §19] are employed to augment standard visual forms of documents (like HTML) with additional elements that assist in the synthesis of the text into audio. In comparison to SSML, ACSS-generated documents are capable of more complex specifications of the audio sequence, including the designation of 3D location of the audio source. Many of the other ACSS elements overlap SSML functionality, especially in the specification of voice type/quality. SSML may be viewed as a superset of ACSS capabilities, excepting spatial audio.
]FIG]

[12] [[Gecko]] は関連する[[特性]]を [[CSSOM]] レベルでは実装していましたが、
[[レンダリング]]は実装していませんでした。

[13] [[Presto]] は [[CSS 2.1]]/[[CSS3]] に基づき [CODE(CSS)@en[[[speech]]]]
を実装していました。

** XML

[1] [[XML]] によるアプローチが [[VoiceXML]] コミュニティーにより行われました。
しかし直接 [[Webブラウザー]]で実装されることはありませんでした。

[FIG(short list)[
- [[SSML]]
- [[SRGS]]
- [[VoiceXML]]
]FIG]

[17] [[SMIL]] や [[SVG]] は[[音声]]や[[動画]]の埋め込みに (仕様上) 対応していました。
しかし [[Webブラウザー]]はこの時点ではこれらを実装しませんでした。

** HTML5

[3] [[Web Applications 1.0]] (現 [[HTML Standard]]) は [CODE(DOMi)@en[[[Audio]]]]
[[API]] を追加しました。これは後に [CODE(HTMLe)@en[[[audio]]]] [[要素]]に統合されています。

[4] その後 [CODE(HTMLe)@en[[[video]]]] [[要素]]と [CODE(HTMLe)@en[[[audio]]]]
[[要素]] ([[媒体要素]]) が追加され、音声出力の [[API]] が整備されました。

** 新しい Web API

[5] [[Web Audio API]]

[18] [[Web MIDI API]]

[19] [CODE(DOMm)@en[[[getUserMedia]]]]

[8] [[Chrome]] は [CODE(HTMLa)@en[[[x-webkit-speech]]]] [[属性]]を実装し、
音声入力を [CODE(HTMLe)@en[[[input]]]] [[要素]]で[[著者]]が促せるようにしました。
手軽に利用できたことから、一部の [[Webサイト]]で利用されました。

[9] その後 [[Web Speech API]] が登場しました。[[Chrome]] はこちらを実装し、
[CODE(HTMLa)@en[[[x-webkit-speech]]]] を廃止しました。

** AT

[22] [[AT]] による間接的な音声出力が、現在最もよく用いられる音声レンダリング手法となっています。
[[AT]] の [[API]] との対応が [[ARIA]] により規定されるようになっています。

** CSS Speech

[23] [[CSS3]] の音声関連機能 ([[css-speech]]) は、ほぼ放置状態にあります。



[6] [CITE@en[Remove <iframe seamless> · whatwg/html@1490eba]]
([TIME[2016-02-04 19:17:07 +09:00]] 版)
<https://github.com/whatwg/html/commit/1490eba4dba5ab476f0981443a86c01acae01311>

[24] [CITE@en[Proposal for HTML modifications]]
([[Or Ben-Natan]]著, [TIME[1997-10-22 08:35:49 +09:00]])
<https://lists.w3.org/Archives/Public/w3c-wai-hc/1997OctDec/0142.html>

[26] [CITE@en[Remove support for sounds from notifications]]
([[beverloo]]著, [TIME[2018-02-28 23:19:53 +09:00]])
<https://github.com/whatwg/notifications/commit/459bf358cae197a5b88c6a227e018756ef4c21cd>

[28] [CITE@en[Remove support for sounds from notifications by beverloo · Pull Request #127 · whatwg/notifications]]
([TIME[2018-03-02 18:10:53 +09:00]])
<https://github.com/whatwg/notifications/pull/127>

[29] [CITE@en['''['''mediaqueries4''']''' Clarify that the speech media type is for pure audio UAs]]
([[frivoal]]著, [TIME[2018-03-19 10:32:13 +09:00]])
<https://github.com/w3c/csswg-drafts/commit/02e8f4cc6f06686b8e1773631b528e5cae13eae8>

[30] [CITE@en['''['''mediaqueries-4 ''']''' Deprecate 'speech' media type as well? · Issue #1751 · w3c/csswg-drafts]]
([TIME[2018-05-08 22:03:52 +09:00]])
<https://github.com/w3c/csswg-drafts/issues/1751>




[31] [[Web Speech API]]