検索について その1
今週より、「検索」をテーマに、
学術情報マメ知識を4週に渡り配信いたします。
ご注目ください!!
*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*
┏━┳────────────────────┓
┃◆ 学術情報マメ知識 検索について その1
┗━┻────────────────────┛
【医学論文の検索】
皆さんは知りたい情報を探すとき、
どのようにしていますか?
たとえば、旅行を計画している人は、
GoogleやYahooなどの検索エンジンを使って
目的地の情報を調べますよね?
では医学論文を探したいときはどうでしょう?
例えば、病院の先生に、
「このような症例の報告はないの?」
と聞かれたらどうしていますか?
GoogleやYahooなどで検索しても、
ある程度の情報は得られるでしょう。
運が良ければピンポイントの論文が
ヒットしてくる事もあるかもしれません。
ただ、このような検索エンジンでは、
全世界のあらゆる情報が得られる代わりに、
信頼性に乏しい情報も
膨大に検索されてしまいます。
また、検索エンジンには
【統制語】(シソーラスやMeSHという名前を
聞いたことがある方も多いかと思います)
というものがないので、本当に探したい情報が
なかなか得られないことが多くあります。
そのため、実際に、医学論文を探すときには、
医学文献に特化したデータベースを使います。
【データベースとは】
データベースとは、大量のデータを
効率よく処理(検索など)できるように
何らかの構造を与えて、
管理できる状態にしたものです。
医学文献のデータベース(代表的なものではPubMed)の場合は、
各文献に、「雑誌名」「著者名」
「出版年」「頁」などの書誌情報と、
「論文タイトル」「アブストラクト」
「キーワード(統制語)」などが付与され、
更に分類が行われて
データベースに登録されています。
【「統制語」って?】
統制語とは、ひとつの概念をひとつの言葉で
表したものです。
例えば、「癌(腫瘍)」という言葉一つとっても、
色々な言い方がなされると思います。
cancer、carcinoma、tumor、tumour、などなど…。
PubMedの場合、
これらを統一して「neoplasms」としています。
たとえば、肝癌のことが
書かれた論文があったとします。
論文中には「liver cancer」と
表記されているものもあれば、
「hepatic carcinoma」と
表記されているものもあります。
この場合、どちらの論文にも、
「liver neoplasms」という統制語が
付与されています。
そのため、「liver neoplasms」という入力だけで、
どちらの表記の文献も検索されます。
統制語は、このように、
「同義語」という言語特有の問題をクリアし、
漏れのない的確な検索を実現する
ために考案されたものです。
【近接演算】
また、近接演算ってご存知ですか?
(不可能なデータベースもあります。
PubMedや医中誌では使えません。)
単語と単語の間にどんな言葉が入っていても、
すべて拾ってくるという検索方法です。
例えば、慢性の白血病の文献を探したい場合、
「慢性白血病」と入力すると、
「慢性骨髄性白血病」と表記されたものは
引っかかってきません。
ところが、近接演算では、
「慢性(4w)白血病」と入力すると
「慢性」と「白血病」の間が4文字以内のものを
すべて検索してくれます。
そのため、「慢性骨髄性白血病」も、
「慢性リンパ性白血病」も、
きちんと検索されます。
----------
ということで…
今回ご紹介した内容を駆使すれば、
データベースを利用する際に、
信頼性が高く、しかも本当に知りたい情報を、
網羅的に、漏れなく探しあてることができます。
(つづく)
*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*
本日の【学術情報マメ知識 検索 その1】は
いかがでしたか?
ご質問やご要望などありましたら
下記メールアドレスまで
お気軽にお送りいただければと思います。
infomap@inforesta.com
次週の検索マメ知識もお楽しみに!!
*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*
メール配信日:2009年7月16日