同義語辞書とは?
~作成、維持管理方法から活用例まで~
本ページは以下のような方におすすめです。 |
1. 同義語辞書とは何か知りたい
2. なぜ今、同義語辞書の作成が必要なのか知りたい
3. 同義語辞書の作成方法を知りたい
4. 同義語辞書を効率良く作る方法を知りたい
5. 作成した同義語辞書を更新したい
6. 同義語辞書の活用例を知りたい
同義語辞書とは何か?
同じ意味を表す単語、複合語を集めたデータです。
通常は、同義語を検索システムに登録したりするため、電子ファイルとして保存されます。
<同義語辞書の例>
この表の場合、各行が同義語群を表しています。
投手 | ピッチャー | ピッチャ | ボウラー | |||
パソコン | PC | パーソナルコンピュータ | ||||
人工知能 | AI | |||||
お父さん | father | 父さん | 実父 | 父 | 父親 | 親父 |
取扱説明書 | manual | 取説 | 説明書 | マニュアル | ||
センターバルブ | Cバルブ |
なぜ今、同義語辞書の作成が必要なのか?
企業の持つ情報資産に適切にアクセスするために必要
同義語辞書の不備は、検索システムの精度悪化など、ボディーブローのように業務の非効率化を招く恐れがあります。
例えば、「センターバルブ」を「Cバルブ」と表現するなど、同じ事象を指す場合でも、担当者によって言葉のゆらぎが生じます。
この言葉のゆらぎが解消されないまま社内文書が作成された場合、共有フォルダや検索システムでのファイル探索時に「必要な情報が見つからない」という問題が起こることになります。
熟練者の退職
同義語辞書を作成するためには、ドメイン知識が豊富で社内独自の用語に詳しい人が必要です。
そういった方々は定年を迎えられる時期にあり、今後作成することが困難になってきます。
そのため、同義語辞書の作成は、今、取り組んでおくことが必要です。
同義語辞書の作成方法(従来の方法)
従来、同義語辞書は、膨大な時間をかけて人手で作るしかなく、取り組むことが困難でした。
1. 社内文書などから用語を抽出
社内に蓄積された社内文書から、ドメイン知識に詳しい人が用語を抽出し、リスト化していきます。
用語の数は何万オーダーに及ぶことがあります。
2. 用語リストの中から同義語を見つけ、グループ化する
ドメイン知識に詳しい人が、抽出した用語の中から同義語を見つけて並べていきます。
同義語辞書作成の所要期間
社内文書の量にもよりますが、弊社ヒアリングによると、同義語辞書の作成には3~6カ月の期間を要します。
このように、同義語辞書の作り方はシンプルです。
しかし、一般的にドメイン知識に詳しい人は忙しく、この作業のための時間を割くことが困難だという問題があるようです。
同義語辞書を効率良く作る方法(新しい方法) |
(アストリーゴ ディクショナリ)
新バージョンをリリース。精度70%を達成しました。
AIが、社内文書から用語抽出、同義語辞書生成を行います。
同義語辞書を効率良く作成したい方に向けて、新バージョンをリリースしました。
公開データによる弊社検証では、精度70%を達成しています。
自然言語処理とAI技術を活用することで自動的に、社内文書から用語を抽出し、同義語辞書を生成します。
1. 社内文書または社内文書の格納されたフォルダを指定する
AStrigo Dictionay上でフォルダまたはファイルを指定し、Word、Excel、PowerPointやPDFファイルをそのまま取り込むことができます。
階層構造のあるフォルダも一括で取り込み可能です。
2. 同義語辞書を自動生成
AStrigo Dictionayの同義語辞書作成ボタンを押し、同義語辞書が自動生成されるのを待ちます。
なお、専門用語辞書が必要な場合は、同義語辞書の作成前に専門用語の自動抽出を行うことができます。
3. AStrigo Dictionayが自動生成した用語、同義語辞書を人手で編集し、完成させる
ドメイン知識に詳しい人により、用語、同義語辞書を完成させます。
AStrigo Dictionayでは、以下のような処理を行いますが、自動抽出、生成される用語、同義語辞書は完全なものではありません。
- 用語、専門用語、複合語を自動抽出し出力
- 文脈から類似用語をグループ分けし、同義語として出力
同義語辞書作成の所要期間
弊社で行った測定では、自動生成と人手による編集作業を合わせて1~2週間で、同義語辞書を完成させることが可能になりました。
これにより、同義語辞書作成にかかる時間が劇的に短縮され、企業が同義語辞書作成に取り組むことが可能となりました。
作成した同義語辞書の更新方法
次々と新たな情報が生み出され、社内文書は日々、作成、更新されていくため、同義語辞書は作成した瞬間から情報の陳腐化を始めます。
従来の作成方法では、その維持管理のためのコストも膨大になります。
AStrigo Dictionayは、既存辞書の更新、活用に対応
AStrigo Dictionaryは、すでに作成、保管されている辞書の取り込みに対応しているため、情報をマージし、より効率的に同義語辞書を維持管理することができます。
1. 社内文書または社内文書の格納されたフォルダを指定する
同義語辞書の新規作成時と同様に、AStrigo Dictionay上でフォルダまたはファイルを指定します。
2. 既存の同義語辞書を指定し、辞書を自動生成
AStrigo Dictionay上で、すでに作成、保管されている同義語辞書を指定します。
あとは同義語辞書の新規作成時と同様に、作成ボタンを押し、同義語辞書が自動生成されるのを待ちます。
3. AStrigo Dictionayが再度、自動生成した用語、同義語辞書を人手で編集し、完成させる
既存の同義語辞書の内容を含んだ、新たな同義語辞書が生成されますので、ドメイン知識に詳しい人により、同義語辞書を完成させます。
同義語辞書の活用例について |
同義語辞書は、企業の情報資産の礎(いしずえ)として、以下のような場面で利活用することが可能です。
- 既存の業務システムの検索精度向上
- テキストマイニングの分析精度向上
- チャットボットの回答精度向上
- マニュアルや技術文書の品質向上
- 名寄せ業務の支援
詳しくはリーフレット、または製品情報をご参照ください。
リーフレットのダウンロード
製品情報