157
回編集
Waterperiod (トーク | 投稿記録) |
|||
48行目: | 48行目: | ||
::図書館は膨大なデータやメタデータの宝庫であり、様々な利活用のデザイン・スペースが広がっている。これらを有効活用するには異種のデータを「つなぐ(結合する)」必要があり、機械処理による効率的な方法が期待される。一方、多くのデータは生のテキストそのものとして存在するため、様々なレベルで自然言語処理の応用が不可欠である。発表者は、業務のかたわら様々なデータソースからの書誌情報の統合と分析に従事しているため、実務者としての知見がたまっている。本発表では、n-gram や levenstein距離といった基本的な自然言語処理アルゴリズムを、オープンソースソフトウェアを駆使してどのように書誌情報処理へ適用しているか紹介する。一方、発表者は必ずしも図書館における情報処理に明るいわけではないため、周辺業務に関するベストプラクティスを参加者間で共有できればと考えている。Python 等による初等的なプログラミング知識があればよいが、必須ではない。 | ::図書館は膨大なデータやメタデータの宝庫であり、様々な利活用のデザイン・スペースが広がっている。これらを有効活用するには異種のデータを「つなぐ(結合する)」必要があり、機械処理による効率的な方法が期待される。一方、多くのデータは生のテキストそのものとして存在するため、様々なレベルで自然言語処理の応用が不可欠である。発表者は、業務のかたわら様々なデータソースからの書誌情報の統合と分析に従事しているため、実務者としての知見がたまっている。本発表では、n-gram や levenstein距離といった基本的な自然言語処理アルゴリズムを、オープンソースソフトウェアを駆使してどのように書誌情報処理へ適用しているか紹介する。一方、発表者は必ずしも図書館における情報処理に明るいわけではないため、周辺業務に関するベストプラクティスを参加者間で共有できればと考えている。Python 等による初等的なプログラミング知識があればよいが、必須ではない。 | ||
===<span id="jkikkawa">「DOI(Digital Object Identifier)入門」(吉川 次郎)</span>=== | ===<span id="jkikkawa">[https://speakerdeck.com/corgies/20160911code4lib-japankanhuarensu2016-doiru-men 「DOI(Digital Object Identifier)入門」(吉川 次郎)]</span>=== | ||
::近年、論文や研究データなどの多様な学術情報を扱う上で、DOI(Digital Object Identifier、デジタルオブジェクト識別子)がますます重要なものとなっている。日本国内の動向として、JaLC(Japan Link Center)における「研究データ利活用協議会」の発足など、DOI登録のみならず、その利活用を志向する段階に移行しつつあると言える。 | ::近年、論文や研究データなどの多様な学術情報を扱う上で、DOI(Digital Object Identifier、デジタルオブジェクト識別子)がますます重要なものとなっている。日本国内の動向として、JaLC(Japan Link Center)における「研究データ利活用協議会」の発足など、DOI登録のみならず、その利活用を志向する段階に移行しつつあると言える。 |
回編集