2004年6月30日水曜日

検索結果にPageRank,WEBRANK実装しました。

先日、ch値算出プログラムがリークしたようですが、とりあえず、動かしてみました。。
企業情報検索エンジンComSearchの企業検索結果に表示するようにしました。
ただし、リアルタイムでPR値を毎回取得する方法はとってません。
前もって登録サイトのPR値をDBに格納しました。
また、Yahoo!のWEBRANKもプログラムで取得しました、こちらは、まだ全件取得
できてません。
Yahoo!のWEBRANKは、ch値みたいなマジックナンバーはありませんので、素直に取得
できるのですが、以下の制限がかかっているようです。
・POST問い合わせのパラメータの順番を場合により入れ替える必要がある。
・1IPアドレスから連続で取得できるのは300~500件でそれ以後、
 1時間~3時間ぐらいはYahoo!から無応答となります。
企業情報検索エンジンComSearch
http://search.picolix.jp/search.php?s_keyword_in=%BE%F0%CA%F3&dmoz=1
http://search.picolix.jp/search.php?s_keyword_in=%BE%F0%CA%F3&search=1


その他、PHPメモ:
 mberegi_replace()関数で、Warning: mberegi_replace(): mbregex compile err: premature end of regular expression
 のエラーが出るので、mberegi_replace()に置き換えた。またmb_ereg_replace("株式会社", "(株)", $company_name, "p");
 のように、POSIXオプションを指定した。

0 件のコメント:

コメントを投稿