<html xmlns="http://www.w3.org/1999/xhtml"><head></head><body><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="1" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[1]</anchor-end> <dfn>SuikaWiki4</dfn> は、 <anchor xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:">SuikaWiki</anchor> の4つ目のメジャー・バージョンでした。</p><section><h1>シェリング</h1><section><h1>/i/$id;terms → ちゃんと実装したので消した</h1><p>文書の tfidf データ &amp; 転置索引データを更新する</p><p>要・ID ロック (文書 XML キャッシュデータ作成のため)</p><p>要・ID ロック (文書 tfidf データ更新のため)</p><p>要・転置索引ロック</p><p>ちょっと遅い</p></section><section><h1>/i/$id;related-$id2, /i/$id;unrelated-$id2</h1><p>$id と $id2 は関係がある、またはないと学習させる</p><p>要・語重みロック (語重みベクトル更新のため)</p></section><section><h1>/g/$nid</h1></section><section><h1>/g/id$id</h1><p>要・ID ロック (グラフノード対応情報取得のため)</p><p>要・グラフロック (グラフノード追加のため)</p></section><section><h1>/n/$names;search → 本実装完了</h1><p>$names を含む文書を表示する</p></section><section><h1>目標</h1><ul><li>各 Wiki page (ID ベース) に関連 Wiki page (ID ベース) のリンクを出す</li><li>各 Wiki page (名前ベース) に含む Wiki page (名前ベース) のリンクを出す</li></ul></section><section><h1>表示 (ID ベース)</h1><ul><li>Wiki page ID からノード ID を引く</li><li>ノード ID から隣接ノード ID を引く</li><li>隣接ノード ID から Wiki page ID を引く</li></ul></section><section><h1>表示 (名前ベース) → 実装済み</h1><ul><li>Wiki page 名から転置索引を開く</li><li>転置索引から Wiki page ID を得る</li></ul></section><section><h1>新規追加</h1><ul><li>Wiki page ID に対応するノード ID を決定する (要・グラフロック)<ul><li>空きノードがあれば、その ID にする</li><li>空きノードがなければ、グラフにノードを追加し、そのうちの1つの ID にする</li></ul></li><li>Wiki page 内容から文書 tfidf データを作成する (要・ID ロック) → 実装済み</li><li>tfidf 転置索引を更新する (要・転置索引ロック) → 実装済み</li></ul><p>(最後の2ステップは少し遅い)</p></section><section><h1>文書更新</h1><ul><li>Wiki page 内容から文書 tfidf データを更新する (要・ID ロック) → 実装済み</li><li>tfidf 転置索引を更新する (要・転置索引ロック) → 実装済み</li></ul><p>(少し遅い)</p></section><section><h1>シェリング更新</h1><ul><li>ある Wiki page ID について</li><li>Wiki page ID に対応するノード ID を決定する<ul><li>ノード ID がなければ停止する</li></ul></li><li>ノードの満足値を決定する<ul><li>2ノード間の満足・不満足判定を行い、満足率を求める</li></ul></li><li>満足値が閾値を下回らない場合、停止する</li><li>ノード移動を行う (要・グラフロック、要・ID ロック)<ul><li>隣接ノード幅優先探索、最大 20 ノードくらい?、見つからなければ停止する</li><li>ID・ノード関連付け情報を更新する</li></ul></li></ul></section><section><h1>満足判定学習</h1><ul><li>ある 2 Wiki page IDs について、</li><li>tfidf データを読み込み、学習を行い、</li><li>語重みベクトルを更新する (要・語重みロック)</li></ul></section></section><section><h1>tfidf データベース → 本実装済み</h1><p>$db-&gt;id_tfidf isa SWE::DB::IDText</p><p>CVS: なし</p><p>キーは文書 ID、値は SWE::Data::FeatureVector を直列化した文字列。</p></section><section><h1>転置索引データベース → 本実装済み</h1><p>$db-&gt;name_inverted_index isa SWE::DB::HashedIndex</p><p>CVS: なし</p><p>キーは語、値は文書 ID と文書の TF・IDF 値のハッシュ。</p></section><section><h1>メモ</h1><p><anchor-end xmlns="urn:x-suika-fam-cx:markup:suikawiki:0:9:" a0:anchor="2" xmlns:a0="urn:x-suika-fam-cx:markup:suikawiki:0:9:">[2]</anchor-end> 
sw
sw4 ids 12956 + sw3 14175<ol><li>27131</li></ol></p></section></body></html>