Google検索への不満

Google検索への不満

[14] Google検索は便利ですが、色々な不満もあります。

実例

[2] 複数の検索語を指定しているとき、そのうちのいくつかを含んでいないページが検索結果に出てくることがよくあります。 すべて含むページが無い時に補足で出すのならともかく、下位にすべて含むページが沢山あるのに、 上位にいくつかの語しか含まない有名サイトが並んでいたり。。。

[5] それ以外でも、検索語に近い無名サイトより、検索語より遠い有名サイトが明らかに優遇されているように見えます。 複合語で検索している場合に、勝手に部分部分に分解されて、ばらばらで全然違う順序で登場するだけの記事がその用語を説明している記事より上位に出たりします。 「""」で括れば改善はされますが・・・。

[3] ゆゆゆで検索してもゆゆ式がトップに出てきます。結城友奈は勇者であるは下の方にあり、何年もかけて少しずつ上がってきてはいますが。。。 たぶんインデックスの作り方的に「ゆゆ」と「ゆゆゆ」が区別できないのでしょう。

[9] >>3 いつからか、1位がゆゆゆい、2位がゆゆゆ公式サイトが出るようになりました。 やればできるんじゃないか。しかし1ページ目に複数個ゆゆ式の結果が出てくるのは変わらず。

[7] 類義語が同一視されます。類義判定される範囲が雑すぎて、 確かに似てはいるけど検索したい語が全然入っていない結果ばかり出てくることがあります。

[11] 「リゾート」と「ビーチ」が同義語扱いされている節があります。謎すぎます。

[8] 英語で検索しているのに、ローマ字で解釈して等しい日本語の (仮名の) 単語がヒットすることがあります。肝心の英語の記事は隠れてなかなかでてきません。

[13] 英語圏発信の情報を検索した時、 英語の本家サイトよりも上位に日本語の非公式のサイトが出ることがあります。 (日本語Webブラウザーで検索しているためか、 日本国内から検索しているためか。) 詳しくないものを検索していると日本語の偽サイトに騙されることになり危険。

[10] Web 関係の仕様書を検索しても、 古い /TR/ ばかり出てきて、 最新の ED が全然出てこない。

[26] 公式の仕様書原文が出てこないで、かわりに非公式で低品質な仕様書の翻訳が出てくることがある。

[4] リアルタイム性が低い。 Twitter 検索に及ばないのは仕方ないとしても、サイトの更新から数日-数ヶ月の時差がある (サイトによって扱いが違う) のは長すぎる。

[12] 逆に、検索語が最近ニュースになったものだと、 各種ニュースサイトやまとめサイトがずらずらと上位に並んで、 その内容はほとんど同じだったりします。 古くからあるその話題を扱ったサイトが押し出されて下位に行っていて、なかなか出てこない。

内容の薄っぺらいコピペサイトではなく、時間をかけて作られた専門サイトがちゃんと出てほしい。

新着情報はGoogleニュースで探せるんだから、通常の Google検索にそういうのをたくさん出す必要はないのでは。

[15] 記事名はタイトルではなく、いろいろな情報から勝手に合成されます。 外部リンクでどのように呼ばれているかも使われているようです。 そのため、間違った名前でリンクされているところがあると、 (それが主流の表記ではなくても) その間違った名前がタイトルに出てくることがあります。 どこにあるかもわからない外部サイトの誤表記なので、 当該記事の著者は修正のしようがありません。


[21] 検索語を NFC か何かで正規化しているようです。 通常はそれで構わないのですが、 "" で括っても適用されます。 したがって旧字体で探したいときに使い物になりません。

異体字を同一視して検索してくれるのは通常は便利なのですが、 NFC で正規化されない旧字体は必ずしも同一視されません (このへん、 どういう基準なのか、法則性が見えません)。 同一視するにせよ、しないにせよ、挙動が一貫していないのが使いにくいのです。

また、検索結果の snippet では常に正規化の結果が表示されるようです。 つまり NFC で正規化される旧字体に限って新字体文字化けするという、 一般人には到底理解不能な現象が起こります。

[29] 検索結果を NFC にして表示している? 旧字体新字体に化けてることが多いです。 検索条件で同一視するのはいいとして、検索結果を改変してしまうのはいかがなものでしょ。

[30] Google検索NFC 以外の漢字異体字を適切に処理してるか怪しいです。 CJK互換漢字以外は使う字体によって検索結果が全然違ったりしますので。

Google 動画検索

[22] YouTube が優遇されてるような...

[25] 複数の動画サイトで配信されてる番組探してるのに YouTube ばかり検索結果に出てくるの酷いよなあ。

[23] でもその割に YouTube 内の検索ほど性能よくないな

[24] だけどその YouTube の検索もゴミばかり引っかかる糞なのだよな

実は解決できる不満

[6] API がない → カスタム検索で意外といろいろできます。ただし有料 (無料枠はわずか) です。

関連

[31] Googleによる多様性の軽視

メモ

[1] ノイズレスサーチ () http://pasokatu.com/nsearch

[16] 最近、Googleで複数のキーワードを使って検索すると『勝手に打ち消し線を引いて取捨選択した結果』を返すから不便「すごい検索精度落ちてる」 - Togetter () https://togetter.com/li/1251697

[17] 「やたら上位に出てくるまとめサイトや商品への誘導記事…」最近のネット検索、欲しい情報手に入らなくなってる説 - Togetter () https://togetter.com/li/1271829

[18] 「RFC ○○○○」でぐぐっても、 IETF の公式サイトが出て来ず、 品質が怪しい個人の感想がでてくる場合があります。

[19] 最近ググっても「いかがでしたか?残念ながらググれる情報はあまりないようです」という状況なので本を買ってる「アナログの情報も大事」「お金を払って買う価値はある」 - Togetter () https://togetter.com/li/1316198

[20] ひめ@女体化したいさんはTwitterを使っています 「Googleで「一九四八」を検索するとジョージ・オーウェルの『1984年』ばかり出てくる こっちは19*48*を検索しとるんじゃ https://t.co/xC7SAYTKjU」 / Twitter (, ) https://twitter.com/sarasvati635/status/1468732548566384640

[27] Xユーザーの林司@るーしゃんずさん: 「有名人が急逝するとGoogleの検索結果が「死因は?家族は?」とか言うクソサイトで埋まるのはいつものことだけど、今日は二番目に「コロナワクチンの副反応?」とか出てて本当にGoogle以下検索サイトは使い物にならなくなったなと絶望してる」 / X, , https://twitter.com/Archangel_HT/status/1721719409608446430

[28] 検閲

[32] 漢字が続く複合語で検索すると2文字くらいの単語に区切って別々に and 検索する方式が日本語検索に合ってないと思うんだよね。わざわざ "" で括らないと1語扱いにしてくれないやつ。

[33] 開発担当者は日本語検索使ったことないんじゃないかな。

[34] どの言語にも対応できる汎言語検索エンジンだ!っていって実は欧米語でしかまともに使えないパターンっしょ

[35] 「ラジオのラジオ」みたいに同じ語が2つ入ってるとなんの役にも立たない検索結果が出てくる ("" で括ればちゃんとした結果になる、最初からそうしろ)