「C4ljp2016/presentation」を編集中
ナビゲーションに移動
検索に移動
この編集を取り消せます。 下記の差分を確認して、本当に取り消していいか検証してください。よろしければ変更を公開して取り消しを完了してください。
最新版 | 編集中の文章 | ||
55行目: | 55行目: | ||
::図書館は膨大なデータやメタデータの宝庫であり、様々な利活用のデザイン・スペースが広がっている。これらを有効活用するには異種のデータを「つなぐ(結合する)」必要があり、機械処理による効率的な方法が期待される。一方、多くのデータは生のテキストそのものとして存在するため、様々なレベルで自然言語処理の応用が不可欠である。発表者は、業務のかたわら様々なデータソースからの書誌情報の統合と分析に従事しているため、実務者としての知見がたまっている。本発表では、n-gram や levenstein距離といった基本的な自然言語処理アルゴリズムを、オープンソースソフトウェアを駆使してどのように書誌情報処理へ適用しているか紹介する。一方、発表者は必ずしも図書館における情報処理に明るいわけではないため、周辺業務に関するベストプラクティスを参加者間で共有できればと考えている。Python 等による初等的なプログラミング知識があればよいが、必須ではない。 | ::図書館は膨大なデータやメタデータの宝庫であり、様々な利活用のデザイン・スペースが広がっている。これらを有効活用するには異種のデータを「つなぐ(結合する)」必要があり、機械処理による効率的な方法が期待される。一方、多くのデータは生のテキストそのものとして存在するため、様々なレベルで自然言語処理の応用が不可欠である。発表者は、業務のかたわら様々なデータソースからの書誌情報の統合と分析に従事しているため、実務者としての知見がたまっている。本発表では、n-gram や levenstein距離といった基本的な自然言語処理アルゴリズムを、オープンソースソフトウェアを駆使してどのように書誌情報処理へ適用しているか紹介する。一方、発表者は必ずしも図書館における情報処理に明るいわけではないため、周辺業務に関するベストプラクティスを参加者間で共有できればと考えている。Python 等による初等的なプログラミング知識があればよいが、必須ではない。 | ||
===<span id="jkikkawa"> | ===<span id="jkikkawa">「DOI(Digital Object Identifier)入門」(吉川 次郎)</span>=== | ||
::近年、論文や研究データなどの多様な学術情報を扱う上で、DOI(Digital Object Identifier、デジタルオブジェクト識別子)がますます重要なものとなっている。日本国内の動向として、JaLC(Japan Link Center)における「研究データ利活用協議会」の発足など、DOI登録のみならず、その利活用を志向する段階に移行しつつあると言える。 | ::近年、論文や研究データなどの多様な学術情報を扱う上で、DOI(Digital Object Identifier、デジタルオブジェクト識別子)がますます重要なものとなっている。日本国内の動向として、JaLC(Japan Link Center)における「研究データ利活用協議会」の発足など、DOI登録のみならず、その利活用を志向する段階に移行しつつあると言える。 |