yoshikazu[dot]ater[at_mark]gmail[dot]com
Google

検索の行く末(ウェブ国産力)

ウェブ国産力 日の丸ITが世界を制す (アスキー新書 047) (アスキー新書 (047))

佐々木俊尚さんの「ウェブ国産力」。既に多くのブログで書評も書かれているので、今回は少し研究と絡めて書いてみようかと思います。殴り書きしたメモは「中の人のメモ帳」で。

(more…)

Gmailのバグか? 検索が反応しないキーワード

Gmailの検索機能、便利ですよね。膨大なメールを処理するとしても、まとめてアーカイブして検索すれば一発で発見!…というのが普通なのですが。Gmailの検索が正しく機能しないキーワードがありました。今回は1つしか紹介できませんが(というか、見つかりませんでしたが)、おそらく他にもあるのではないかと思います。

ちょっとGoogleさんにも連絡入れてみます。(自分の操作ミスでは無いと思います…何度も試してみたので…)

東大生ブログランキング

(more…)

「検索」から始める起業術(検索キーワード「超」起業術)

やや古めの本ですが。SEO界のカリスマとも言える、鈴木将司さんの1冊です。「起業」まで進むかどうかは別にして、マインドマップやWordPressなどのテーマ別ブログに対して何かいいアイデアでも出てこないかな〜と読んでみました。

キーワード 甘く見てると 大失敗?

読書マインドマップ:検索キーワード「超」起業術

東大生ブログランキング

(more…)

擬音語・擬態語の効果【擬態語・擬音語を索引語に用いた病名の自動検索に関する研究】

論文紹介

  • 擬態語・擬音語を索引語に用いた病名の自動検索に関する研究
  • 石田博子、小野木雄三
  • 第26回医療情報学連合大会(2-D-1-2)、2006、日本

背景と目的

患者の発話・診療時間の長さと、患者の理解との間には乖離がある。この理由として、患者は痛みなどの感覚、不安などの感情が優先し、身体現象を正しく(客観的、論理的に)説明することが困難である事、医学用語と一般用語の差、などが考えられる。

この研究では、感覚の比喩表現である擬態語や擬音語(日本特有)に着目し、そこから病名検索の精度を向上させることを考える。

方法

コーパスより構文解析・形態素解析を行い、擬態語・擬音語を切り出す。

「医疾患」、「擬音語・擬態語」「医部位」という語(あるいは属性)を用いて検索語のサンプルとしている。

結果と考察

初期の段階では、そもそも擬音語や擬態語を含まない文章が多かった。これに対して、索引語拡張を行ったことにより、検索の有効性を確認した。その結果、「擬態語・擬音語+部位」という検索を行うことで、6倍以上の文書に対して検索が可能になっていた。

思いつきメモ

より広範囲な類語辞書の作成

専門知識を持たないような人々でも、日常的に使っているような言葉(話し言葉など)を類語辞書に含めることで、検索性度の上昇、さらにはテキスト分析の効率UPを考えることができそう。

他にも有用そうな言葉は?

日常で使われる」という観点に着目すると、他にも検索精度を上げていくための言葉が見つかりそう…な、気もする。

編集後記

ちょっと予約投稿が変…動作チェックも兼ねて投稿。