カテゴリ別 2003年 | 2004年 | 2005年 | 2006年 | 2007年 | 2008年
知り合いサイト: よんだもの / 暴想 / Linuxでやる夫 / 新宿Vipper / 僕だけが幸せになればいいのに。
今さらながら OPML について調べています。実際に作られている OPML を見るとデファクトがあるようなないような状態ですね。
リファラスパムがしつこいのでとりあえず適当に対応しました。
RewriteEngine on
RewriteCond %{HTTP_REFERER} ********\.com [OR]
RewriteCond %{HTTP_REFERER} ********\.com [OR]
RewriteCond %{REMOTE_ADDR} **\.**\.**\.**$ [OR]
RewriteCond %{REMOTE_ADDR} **\.**\.**\.**$ [OR]
RewriteCond DUMMY CONDITION
RewriteRule ^.*$ [F]
RewriteCond で列挙したリファラかリモートアドレスのどれかにマッチしたら、Forbidden ( [F] ) にするというだけです。
ローカルファイルを検索する「Google Desktop Search」ベータ版公開
米Googleは14日、「Google Desktop Search」のベータ版を公開した。これはインターネットに加え、ローカルなコンピュータの中に含まれているファイルを高速に検索できるアプリケーションである。
早速インストールしてみました。このソフトの一番素晴らしいところは、UI が Google 検索と統一的に提供されるところだと思います。スタートボタンから検索を選んだり、メーラを立ち上げて検索したり、cygwin ターミナルを立ち上げて grep したり、Firefox で Google 開いたりと、探す対象によって行う作業を変える必要がなくなるわけですから。設定項目がほとんどなにもなく、インストールが済んだら放置するだけでバックグラウンドでインデックスを作ってくれる点も、導入障壁が低くていいですね。
で、実際の使い勝手なのですが、多バイト文字コードには対応していますが、日本語には対応していませんのでまだ実用にはならないです。インデックス化するときに、英語に合わせて空白文字か句読点を区切りにして「単語」の切り出しをしているようです。例えば、「東京、特許、許可局」「東京 特許 許可局」なら『東京』『特許』『許可局』が検索可能ですが、「東京特許許可局」だと『東京特許許可局』全体が一つのキーワードになるようです。
また現在のところGoogle Desktop Searchは英語と英語に類するわずかな言語にしか対応していない。実際に試してみたところ日本語での検索はできず、英単語で検索した場合にも日本語ファイルの内容が正常に表示されることはなかった。Googleでは将来的にはできるだけ多くの言語に対応したいとしている。
とありますようにいずれは日本語に対応するでしょうから期待です。exe や dll のリソースを眺めたところ、WinAMP や PDF のアイコンがあったので、対応するファイルの種類も増えていくのでしょうね。プラグインの API が公開されれば、ネット上の特定のリソース(例えば ML アーカイブとか、社内の wiki/blog の RSS とか)を取ってきて検索対象にするなど応用ができそうです。
「るびま」こと >Rubyist Magazine の第二号がリリースされました。前回にも増して中身が濃いです。
個人的に興味深い記事を紹介されていただきますと、
Berkeley DB XML は、アプリケーションへの組み込みに向いている軽量データベースとして有名な Berkeley DB の姉妹品。データベース板 の XML統合スレッド で話題になっていたので使ってみようかと思ったのですが、結構ビルドが大変です。
Berkeley DB 5.1 以降、Xerces-C 2.3 以降、Pathan 1.2 以降といったライブラリが必要です。Gentoo 標準の ebuild では Xerces-C を pthread 対応でビルドしないので適当に修正したり、Pathan の ebuild を書いたりして、Berkeley DB XML が make できるところまでは行きましたが undefined reference で止まるので一時断念。作業記録を載せておきます。
$ CPPFLAGS="-I/usr/include/db4.2" ../dist/configure --enable-java --enable-tcl --with-tcl=/usr/lib \
--with-berkeleydb=/usr --with-pathan=/ --with-xerces=/usr
..snip..
$ make
..snip..
/bin/sh ./libtool --mode=link g++ -o dbxml_dump dbxml_dump.lo libdbxml-1.2.la \
/usr/lib/libdb_cxx-4.2.la //lib/libpathan.la -L/usr/lib -R/usr/lib -lxerces-c -lpthread
libtool: link: warning: library `//lib/libpathan.la' was moved.
libtool: link: warning: library `//lib/libpathan.la' was moved.
g++ -o .libs/dbxml_dump .libs/dbxml_dump.o ./.libs/libdbxml-1.2.so -L/usr/i686-pc-linux-gnu/bin \
/usr/lib/libdb_cxx-4.2.so //lib/libpathan.so /usr/lib/gcc-lib/i686-pc-linux-gnu/3.3.4/libstdc++.so \
-L/usr/lib -lxerces-c -lpthread -Wl,--rpath -Wl,/usr/local/BerkeleyDBXML.1.2/lib \
-Wl,--rpath -Wl,//lib -Wl,--rpath -Wl,/usr/lib/gcc-lib/i686-pc-linux-gnu/3.3.4 -Wl,--rpath -Wl,/usr/lib
./.libs/libdbxml-1.2.so: undefined reference to `__db_getlong'
./.libs/libdbxml-1.2.so: undefined reference to `__db_prheader'
./.libs/libdbxml-1.2.so: undefined reference to `__db_prfooter'
./.libs/libdbxml-1.2.so: undefined reference to `__db_prdbt'
./.libs/libdbxml-1.2.so: undefined reference to `__db_getulong'
./.libs/libdbxml-1.2.so: undefined reference to `__os_clock'
collect2: ld returned 1 exit status
make: *** [dbxml_dump] Error 1
$ objdump -x .libs/libdbxml-1.2.so | grep __db_getlong
00000000 *UND* 00000000 __db_getlong
本当は USE の threads を見ないといけないのだけど手抜き。
--- /usr/portage/dev-libs/xerces-c/xerces-c-2.6.0.ebuild 2004-10-05 00:58:16.000000000 +0900
+++ /usr/local/portage/dev-libs/xerces-c/xerces-c-2.6.0.ebuild 2004-10-17 03:50:13.000000000 +0900
@@ -21,6 +21,7 @@
src_compile() {
export XERCESCROOT=${S}
cd src/xercesc
+ ./runConfigure -plinux
econf || die
emake -j1 || die
}
ソースのバージョン表記が 1.2-2 と一般的でないのと、xerces-c のソースを必要とするのがややこしい。どうすれば綺麗に書けるんでしょ。/lib にインストールされてしまうのも直したいところ。
# Copyright 1999-2004 Gentoo Foundation
# Distributed under the terms of the GNU General Public License v2
# $Header:$
MY_PV="1.2-2"
MY_P=${PN}-${MY_PV}-src
DESCRIPTION="Pathan is an XPath parsing and evaluation module from Decisionsoft for use with the Xerces-C XML parser by The Apache Software Foundation."
HOMEPAGE="http://software.decisionsoft.com/"
SRC_URI="http://software.decisionsoft.com/software/pathan-1.2r2/${MY_P}.tar.gz"
LICENSE="The DecisionSoft Open Source Licence"
SLOT="0"
KEYWORDS="~x86"
IUSE=""
DEPEND=">=dev-libs/xerces-c-2.3"
S=${WORKDIR}/${PN}-1.2
XERCESC="xerces-c-src_2_6_0"
src_unpack() {
unpack ${A}
cd ${S}
unpack ${XERCESC}.tar.gz
}
src_compile() {
export XERCESCROOT="${S}/${XERCESC}"
econf --prefix=${D} || die
emake -j1 || die
unset XERCESCROOT
}
src_install () {
export XERCESCROOT="${S}/${XERCESC}"
make DESTDIR=${D} install || die
dodoc CREDITS LICENSE.TXT README
dohtml Readme.html
unset XERCESCROOT
}
esehttpd のサイトってどこに行ってしまったんでしょうか。sourceforge のページはありますが。
というのも、Yahoo で esehttpd を検索するとこの日記が一番上に来てしまうので、よろしくないなあと。
Wiki にフォローページを作りました。
Berkeley DB XML をビルドしてみる の続きです。
そういえば肝心の Gentoo の bugzilla を調べてなかったなということで検索。[Bugzilla Bug 24473 Ebuild request for Berkeley DB XML] を発見。
要約するとこんなことでした。
Gentoo では複数バージョンを共存させるために Berkeley DB を --with-uniquename 付きでビルドしているので 4.2 系列はシンボルに _4002 というサフィックスが付きます。一方 Berkeley DB XML はエクスポートしていない関数を使っているので、undefined reference になると。回答されている方は、解決策として DB XML 用に Berkeley DB を別途用意することを薦めています。
以上を踏まえて Xerces-C と libpathan は先日の日記に書いた通りでインストールして、Berkeley DB だけ自前でビルドしてやり直してみました。
$ tar fvzx db-4.2.52.tar.gz; cd db-4.2.52/build_unix
$ ../dist/configure --enable-compat185 --enable-cxx --enable-java \
--enable-rpc --enable-tcl --with-tcl=/usr/lib
$ make; make install
..snip..
$ tar fvzx dbxml-1.2.1.tar.gz; cd dbxml-1.2.1/build_unix
$ CPPFLAGS="-I/include -I/usr/local/BerkeleyDB.4.2/include" ../dist/configure \
--enable-java --enable-tcl --with-tcl=/usr/lib \
--with-berkeleydb=/usr/local/BerkeleyDB.4.2/ --with-pathan=/ --with-xerces=/usr
$ make; make install
これで Berkeley DB は /usr/local/BerkeleyDB.4.2、Berkeley DB XML は /usr/local/BerkeleyDBXML.1.2 にインストールされました。あとは Ruby バインドのビルドですね。。。
Spread Firefox キャンペーンの一環として、Firefox 1.0のリリースを記念を New York Times に全面広告を掲載する事が現在計画されています。
$30 以上ドネーションをするとその広告に名前が載るそうです。とりあえず一口乗りました。Spread Firefox に行って、右上の「Help get full-page ad into NYTimes!」な画像をクリックするとドネーションできます。現在 2497 名が名前の載るドネーションをされているようです。目標が 2500 名ということなのでもうすぐ達成しそうですね。
オープンソースブラウザFirefoxの全面広告をThe New York Times紙に掲載するため、Firefoxファンらが行っていた寄付金募集のキャンペーンが、わずか3日間で目標金額を達成した。
sfxサイトによると、広告掲載後余った資金は他のMozillaプロジェクトで利用されるという。
上を書いてから数時間後には目標を達成していました。現在すでに 6,000 人以上になっています。個人的には余った分は SVG や XForms の開発に使ってほしいですね。
void GraphicWizardsLair( void ); // 経由です。
Google 検索のアーキテクチャについて。おお、後で読もうー。
「esehttpd のサイトってどこに行ってしまったんでしょうか。」ってもうちょっとsourceforge のページの周りを見てみればみつかったのに。
ありがとうございます。SourceForge.jp: Project Info - esehttpd からは飛べないし、検索でも見つからないので、それ以上頭を働かせませんでした……
最近のコメント:
RSS
![]()
This work is licensed under a
Creative Commons License
(note: text only. w/o web design, citations, (re)distributed softwares).
_ miyagawa [MP3はすでに検索できるみたいです(ファイル名だけ?) AAC(iTunes) は無理でした。 ]
_ だて [ファイル名だけみたいですね。 しかし、ネットワークドライブまでがんがんインデックス化するのはイントラで便利なのか危険..]