HTMLの統計

Webの統計

[12] HTMLWeb技術の利用に関するWebページの大規模な実態調査は、 にはじめて発表されました。 Google 社が Google検索索引データを活用して全世界の Webページを対象に行なったもので、 担当者は明記されていませんが、 Ian Hickson によるものだと知られています。

[13] 当時 Ian HicksonWHATWGHTML5 を開発していました。 (Google 社員でしたが100%の割合で HTML の標準化に従事していました。) この調査結果はその後の HTML5 の新機能の追加や既存機能の改良に活用されました。

[14] 実在する Webページの状態を統計的な処理によって把握し、 Web標準の開発に活用するという手法はこれが歴史上初めてでした。 これ以後徐々に態勢が整えられ、 今では当然のように行われています。

[15] ところでこのの調査結果は衝撃的な内容を含んでいました。 それは誰しもが薄々感じていたことではありましたが、 はっきり数字を示されたことで、 現実を直視せざるを得なくなりました。 すなわち、

[90] Google Code: Web Authoring Statistics http://code.google.com/webstats/index.html (名無しさん 2006-01-26 07:45:55 +00:00)

[91] >>90

Google Code http://code.google.com/ の紹介文:

How do developers use HTML? - 20/Jan/2006

As part of our work with the WHAT working group, who are writing proposals for a new version of HTML, we have done some research into what aspects of HTML authors are using today. We took a sample of slightly over a billion documents, and looked at what elements were used on the most pages, what class names were used on the most pages, and so forth. The results are quite interesting!

担当者の名前が書いてないけど、内容的にIan Hickson (ら?) の仕事だろう。

(名無しさん 2006-01-26 07:59:42 +00:00)

[94] Web Standards in Estonia vol 3 http://triin.net/2006/03/11/Web_Standards_in_Estonia_vol_3 (名無しさん 2006-03-12 23:21:57 +00:00)

[95] Semantics http://www.w3.org/2006/03/01-Hickson/Semantics.html

>>90-91 に関するIan Hicksonの発表資料 (でもこの HTML 文書は明らかに Ian のものではないw)

(名無しさん 2006-03-28 13:32:12 +00:00)

[96] >>95 タグ名もクラス名も赤いなあwwwwwwww そこに意味などないなあ。

タグ名には ISO-2022-JP の切れ端みたいなのがいくつかまじってるwww

(名無しさん 2006-03-28 13:35:22 +00:00)

[16] 関連記事: class, main

[99] Coding practices of web pages http://www.triin.net/2006/06/12/Coding_practices_of_web_pages (名無しさん 2006-06-17 03:10:45 +00:00)

[101] Web::Blogoscope: 都道府県の脱テーブル状況[2006年6月版] http://www.cybergarden.net/blog/2006/06/post-tablelayout_ad_2006-06.html (名無しさん 2006-07-04 11:48:26 +00:00)

[102] Re: Web page stats from Ian Hickson on 2006-10-03 (www-qa@w3.org from October 2006) http://lists.w3.org/Archives/Public/www-qa/2006Oct/0001.html (名無しさん 2006-10-28 13:17:46 +00:00)

[103] Re: Web page stats from Ian Hickson on 2006-09-28 (www-qa@w3.org from September 2006) http://lists.w3.org/Archives/Public/www-qa/2006Sep/0004.html (名無しさん)

[104] Re: Web page stats from Bjoern Hoehrmann on 2006-09-28 (www-qa@w3.org from September 2006) http://lists.w3.org/Archives/Public/www-qa/2006Sep/0007.html (名無しさん)

[105] dog or higher: Semantics in the wild http://westciv.typepad.com/dog_or_higher/2005/11/real_world_sema.html (名無しさん)

[106] Re: Unicode distribution? from Erik van der Poel on 2007-01-05 (www-international@w3.org from January to March 2007) (Erik van der Poel (erikv@google.com) 著, 2007-01-07 23:27:03 +09:00 版) http://lists.w3.org/Archives/Public/www-international/2007JanMar/0004 (名無しさん 2007-01-12 21:11:34 +00:00)

[107] HTML (Rene Saarsoo 著, 2007-03-15 17:56:53 +09:00 版) http://triin.net/2006/06/12/HTML (名無しさん)

[109] Re: survey of top web sites (David Dailey 著, 2007-05-01 00:41:57 +09:00 版) http://lists.w3.org/Archives/Public/www-archive/2007Apr/0079.html

方法論についての議論。 (名無しさん 2007-06-04 13:16:01 +00:00)

[110] HTML-LINT RANKING (2007-06-04 04:08:40 +09:00 版) http://www.aland.to/~lintrank/table.html (名無しさん)

[111] Tripleodeon » dotMobi uptake (2007-06-10 13:09:29 +09:00 版) http://www.tripleodeon.com/?p=33 (名無しさん 2007-06-10 04:17:05 +00:00)

[112] Identifying, Selecting, and Organizing the Attributes of Web Resources http://www.lib.utexas.edu/etd/d/2004/paschvaldesg042/paschvaldesg042.pdf

(名無しさん)

[113] Re: windows-874 new registration (Erik van der Poel 著, 2007-06-16 20:00:32 +09:00 版) http://permalink.gmane.org/gmane.ietf.charsets/327 (名無しさん 2007-06-24 08:42:38 +00:00)

[114] Re: windows-874 new registration (Erik van der Poel 著, 2007-06-16 20:00:32 +09:00 版) http://permalink.gmane.org/gmane.ietf.charsets/327 (名無しさん 2007-06-24 08:48:14 +00:00)

[115] Re: windows-874 new registration (Erik van der Poel 著, 2007-06-16 20:00:32 +09:00 版) http://permalink.gmane.org/gmane.ietf.charsets/327 (名無しさん 2007-06-24 08:52:32 +00:00)

[116] HTML5 IRC logs: freenode / #whatwg / 20070715 (2007-07-16 12:12:38 +09:00 版) http://krijnhoetmer.nl/irc-logs/whatwg/20070715#l-65 (名無しさん 2007-07-16 03:13:51 +00:00)

[117] HTML statistics (2007-07-18 22:04:54 +09:00 版) http://canvex.lazyilluminati.com/survey/2007-07-17/analyse.cgi/index (名無しさん 2007-07-18 13:07:28 +00:00)

[118] Why Bother? | The Elementary Standards (Sean Fraser 著, 2007-07-26 23:42:31 +09:00 版) http://www.elementary-group-standards.com/web-standards/why-bother-with-web-standards.html (名無しさん)

[119] Sam Ruby: Persai Feedcorpus Status (2007-07-31 21:48:10 +09:00 版) http://www.intertwingly.net/blog/2007/07/30/Persai-Feedcorpus-Status (名無しさん 2007-08-04 02:42:36 +00:00)

[120] Blogging Persai Persai Feed Corpus Now Available (2007-07-31 08:05:05 +09:00 版) http://blog.persai.com/2007/7/29/persai-feed-corpus-now-available (名無しさん)

[121] Google Code - Updates: Optimisation data for HTML5 parser implementors (2007-08-09 13:25:27 +09:00 版) http://google-code-updates.blogspot.com/2007/08/optimisation-data-for-html5-parser.html (名無しさん)

[122] Top blogs fail W3C Markup Validation (2007-08-11 00:58:34 +09:00 版) http://bugleak.com/2007/08/top-blogs-fail-w3c-markup-validation/ (名無しさん)

[123] Coding practices of web pages (Rene Saarsoo 著, 2006-06-12 18:00:42 +09:00 版) http://triin.net/archive/kool/webstat/webstat.html (名無しさん)

[124] 自治体サイトWebアクセシビリティ調査|有限会社ユニバーサルワークス (2007-09-01 10:41:30 +09:00 版) http://www.u-works.co.jp/jichitai/ (名無しさん)

[125] A little statistics on linked style sheets (Bert Bos 著, 2007-10-23 14:13:35 +09:00 版) http://permalink.gmane.org/gmane.comp.web.css.general/4229 (名無しさん)

[126] RE: Comments on: Access Control for Cross-site Requests (Ian Hickson 著, 2007-12-21 14:05:50 +09:00 版) http://lists.w3.org/Archives/Public/public-appformats/2007Dec/0062.html (名無しさん)

[127] MAMA - Opera Developer Community ( 版) http://dev.opera.com/articles/view/mama/

[128] Common Web Server software comparison report ( 版) http://www.http-stats.com/

[129] Google Japan Blog: 大規模日本語 n-gram データの公開 ( 版) http://googlejapan.blogspot.com/2007/11/n-gram.html

[130] 英語が一番、では二番目は?…インターネットで使われている言語の普及率をグラフ化してみる:Garbagenews.com ( 版) http://www.garbagenews.net/archives/1392757.html

[131] IRC logs: freenode / #whatwg / 20100725 ( 版) http://krijnhoetmer.nl/irc-logs/whatwg/20100725#l-205

[132] syndication : Message: 2nd RSS Survey Results ( ( 版)) http://tech.groups.yahoo.com/group/syndication/message/330

[133] Security Headers on the Top 1,000,000 Websites ( ( 版)) http://www.veracode.com/blog/2012/11/security-headers-report/

[134] Google Chrome Developers - Google+ - On the Chrome team, we’ve been curious about the adoption… ( ( 版)) https://plus.google.com/+GoogleChromeDevelopers/posts/Rh1aMkzucgV

[135] Web Platform Feature Metrics ( ( 版)) http://googlechrome.github.com/webplatform-metrics/

[136] HTTP Archive - Trends ( ( 版)) http://httparchive.org/trends.php

[1] UKOLN - WebWatch - Academic Library Websites ( 版) http://www.ukoln.ac.uk/web-focus/webwatch/reports/hei-lib-may1998/report.html

[2] Microformats | weblog | microformats.org at 7 ( 版) http://microformats.org/2012/06/25/microformats-org-at-7

[3] Re: "fast vs complete" is "SAX vs DOM"? and the IDs? (Boris Zbarsky 著, 版) https://lists.w3.org/Archives/Public/www-style/2015Mar/0137.html

[4] Web Font Media Type Analysis - Google ドキュメント ( 版) https://docs.google.com/document/d/1kP3Edo3nDN_2HS6IZK6DMnrvEG1StbY5OKmbwA1ilXI/edit

[5] Web Font Media Type Analysis 2015 - Google ドキュメント ( 版) https://docs.google.com/document/d/1Tsju6EOP4LqJ1RcFJRpqxryggbWZYbq5jvsIhVYNoyU/edit

[6] Official Google Reader Blog: Namespaced Extensions in Feeds ( 版) http://googlereader.blogspot.jp/2006/08/namespaced-extensions-in-feeds.html

[7] Validator statistics () https://validator.w3.org/nu/stats.html

[8] Chrome User Experience Report  |  Tools for Web Developers  |  Google Developers () https://developers.google.com/web/tools/chrome-user-experience-report/

[9] Chrome User Experience Report: expanding to top 1 Million+ origins  |  Web  |  Google Developers () https://developers.google.com/web/updates/2017/12/crux?utm_source=feed&utm_medium=feed&utm_campaign=

[11] Markup | 2019 | The Web Almanac by HTTP Archive, https://almanac.httparchive.org/en/2019/markup

[10] Markup | 2020 | The Web Almanac by HTTP Archive, https://almanac.httparchive.org/en/2020/markup