speech

Webにおける音声

関連

[27] 媒体要素vibrate も参照。

歴史

[2] Web による音声入出力には長い歴史がありますが、未だ成熟していません。

HTML

[15] Netscapeembed により間接的に音声出力に対応しました。

[14] IEbgsound, <img dynsrc> により音声出力に対応しました。後に object により間接的に対応し、 こちらが主流となりました。

[16] その後しばらく音声機能が直接 Webブラウザーで実装されることはありませんでした。

[20] device-uploadフォームの音声入力機能を提案しましたが、実装されませんでした。

[21] ガラケー用の Webブラウザーは、 object 要素などを使って独自の音声再生機能を実装していました。

CSS

[10] CSS 2.0媒体型 aural と関連する特性を規定していました。 Emacs/W3 + Emacspeak の実装に基づいていました。

[11] CSS 2.1CSS3媒体型 speech に置き換えるとともに、 複数の実装が無いとして、関連する特性規定から参考/CR レベルに格下げしました。

[7] BEP and Emacs-W3 <http://www.argv.org/bep/doc/jarvi10/bep.html#w3-demo>

例文 & レンダリング例あり。

[25] Speech Synthesis Markup Language (SSML) Version 1.1 ( 版) <http://www.w3.org/TR/2010/REC-speech-synthesis11-20100907/#S2.3.2>

Aural Cascading Style Sheets [CSS2 §19] are employed to augment standard visual forms of documents (like HTML) with additional elements that assist in the synthesis of the text into audio. In comparison to SSML, ACSS-generated documents are capable of more complex specifications of the audio sequence, including the designation of 3D location of the audio source. Many of the other ACSS elements overlap SSML functionality, especially in the specification of voice type/quality. SSML may be viewed as a superset of ACSS capabilities, excepting spatial audio.

[12] Gecko は関連する特性CSSOM レベルでは実装していましたが、 レンダリングは実装していませんでした。

[13] PrestoCSS 2.1/CSS3 に基づき speech を実装していました。

XML

[1] XML によるアプローチが VoiceXML コミュニティーにより行われました。 しかし直接 Webブラウザーで実装されることはありませんでした。

[17] SMILSVG音声動画の埋め込みに (仕様上) 対応していました。 しかし Webブラウザーはこの時点ではこれらを実装しませんでした。

HTML5

[3] Web Applications 1.0 (現 HTML Standard) は Audio API を追加しました。これは後に audio 要素に統合されています。

[4] その後 video 要素audio 要素 (媒体要素) が追加され、音声出力の API が整備されました。

新しい Web API

[5] Web Audio API

[18] Web MIDI API

[19] getUserMedia

[8] Chromex-webkit-speech 属性を実装し、 音声入力を input 要素著者が促せるようにしました。 手軽に利用できたことから、一部の Webサイトで利用されました。

[9] その後 Web Speech API が登場しました。Chrome はこちらを実装し、 x-webkit-speech を廃止しました。

AT

[22] AT による間接的な音声出力が、現在最もよく用いられる音声レンダリング手法となっています。 ATAPI との対応が ARIA により規定されるようになっています。

CSS Speech

[23] CSS3 の音声関連機能 (css-speech) は、ほぼ放置状態にあります。

[6] Remove <iframe seamless> · whatwg/html@1490eba ( 版) <https://github.com/whatwg/html/commit/1490eba4dba5ab476f0981443a86c01acae01311>

[24] Proposal for HTML modifications (Or Ben-Natan著, ) <https://lists.w3.org/Archives/Public/w3c-wai-hc/1997OctDec/0142.html>

[26] Remove support for sounds from notifications (beverloo著, ) <https://github.com/whatwg/notifications/commit/459bf358cae197a5b88c6a227e018756ef4c21cd>

[28] Remove support for sounds from notifications by beverloo · Pull Request #127 · whatwg/notifications () <https://github.com/whatwg/notifications/pull/127>

[29] [mediaqueries4] Clarify that the speech media type is for pure audio UAs (frivoal著, ) <https://github.com/w3c/csswg-drafts/commit/02e8f4cc6f06686b8e1773631b528e5cae13eae8>

[30] [mediaqueries-4 ] Deprecate 'speech' media type as well? · Issue #1751 · w3c/csswg-drafts () <https://github.com/w3c/csswg-drafts/issues/1751>