検索について その3
全4週にわたり、「検索」をテーマにお送りしている「学術情報マメ知識」。
第三回目の今回は、多くの方にはなかなか馴染みがないけど、
データベースには欠かすことの出来ない「統制語」について、分かりやすく説明します。
*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*
┏━┳──────────┓
┃◆ 『統制語』について
┗━┻──────────┛
【統制語】
(データベースによって、MeSH、シソーラス用語などと呼ばれます)
本シリーズの第一回目で簡単にご説明したように、
「統制語」とは、ひとつの概念をひとつの言葉で表したものです。
※以下、第一回目の引用です
------------------------------------------------------------
例えば「癌(腫瘍)」という言葉一つとっても、色々な言い方がなされると思います。
cancer、carcinoma、tumor、tumour、などなど…。
PubMedの場合、これらを統一して「neoplasms」としています。
〜中略〜
そのため「liver neoplasms」という入力だけでどちらの表記(cancer、carcinoma)の文献も検索されます。
統制語はこのように「同義語」という言語特有の問題をクリアし、
漏れのない的確な検索を実現するために考案されたものです。
------------------------------------------------------------
このような概念と言葉の対応は、数多く存在します。
そして、それらの言葉を用語集としてまとめたものを「シソーラス」と言います。
ただし、シソーラスはただの用語集ではありません。
言葉同士の上位、下位関係など、収録されている言葉同士の関係が記されており、
いくつもの言葉の体系が形作られています。(詳しくは後述します)
<MeSHについて>
「MeSH(メッシュ)」とは「Medical Subject Headings」の略であり、
医学分野において代表的な「用語集」のひとつです。
たとえば、「MeSH」においては、
「癌」という概念は(先に引用したように)「neoplasms」という言葉に統一されています。
------------------------------------------------------
「癌」の「neoplasms」への統一例
論文での表現 MEDLINEのキーワード
Cancer
Carcinoma → MeSH → neoplasms
Neoplasm
------------------------------------------------------
このような言葉の統一を行っているため、
「MeSH」を用いている「PubMed」では、
「neoplasms」というキーワードで検索を行えば、
(先の引用で示した通り)
癌を「cancer」と表している論文も「carcinoma」と表している論文も、自動的に検索されます。
さらに「MeSH」では各言葉同士が、
広い意味の言葉から狭い意味の言葉まで、階層構造となっています。
------------------------------------------------------
PubMed(MEDLINE)の場合 (MeSHの階層構造の一例)
Liver Diseases ← 肝臓疾患
Liver Neoplasms ← 肝臓腫瘍
Carcinoma, Hepatocellular ← 肝細胞癌
------------------------------------------------------
これらの言葉は、論文ごとに適切な言葉が複数ピックアップされ、
キーワードとして付与されています。
また、この階層構造は「上位は下位を含む」というルールに基づいています。
例えば、「Liver Diseases(肝臓疾患)」
というキーワードで検索を行った場合、
下位概念である「Liver Neoplasms(肝臓腫瘍)」や「Carcinoma, Hepatocellular(肝細胞癌)」
といったキーワードが付与された文献も自動的に検索されます。
逆に、「Carcinoma, Hepatocellular(肝細胞癌)」
というキーワードを用いて検索を行った場合、
上位概念である「Liver Diseases(肝臓疾患)」や「Liver Neoplasms(肝臓腫瘍)」
といったキーワードが付与された文献は検索結果に現れません。
このように、論文の検索を行う際に、
MeSHの階層構造を参考にし、適切なキーワードで検索を行うと、
的確かつ、より絞り込まれた検索結果を得られます。
また、「医中誌Web」にもこのような用語集(シソーラス)は実装されており、
「MeSH」同様、より的確な検索を行いたい場合はその階層構造を理解しておく必要があります。
*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*
今回のお話「統制語」は、いかがだったでしょうか。
難しく感じられた方も多いかと思いますが、
「統制語」は、検索のスキルをアップする際には欠かせないものです。
インフォレスタには、プロのサーチャーがこの統制語も駆使しながら、
お客様がご希望するテーマに沿った文献をリスト化してお届けするサービスもございます。
文献を探すのが難しい、プロに任せたいという方は、ぜひご利用ください↓
インフォレスタのキーワード検索サービス
*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*
<補足>
前回の記事でPubMedの収録年代を「1949年〜」と記載いたしましたが、
PubMedは現在も過去に遡って収載を行っており、1800年代の文献も一部検索可能です。
*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*〜*