「C4ljp2016/presentation」の版間の差分

提供:Code4Lib JAPAN
ナビゲーションに移動 検索に移動
(ひな形を作成)
 
(→‎ロング発表(5件): タイトル、発表概要の追加)
27行目: 27行目:
==ロング発表(5件)==
==ロング発表(5件)==


===<span id="kando">「プリントディスアビリティのある人のための資料のテキストデータ化、そして、その課題」(安藤 一博)</span>===
::視覚障害やディスレクシアなど様々な理由で印刷物の利用に困難のある(プリントディスアビリティのある)人のために、図書館はこれまで資料の点字化、音声化(つまり、録音図書の製作)、拡大化など様々な方法によって資料を製作し、提供してきた。そして、近年では、2009年の著作権法の改正や合成音声技術などのICT技術の発達により、資料をテキストデータ化する機関や団体も出てきている。国立国会図書館は、1975年から約40年学術文献の録音図書を製作してきたが、テキストデータ化のメリットを考慮すると、学術文献のテキストデータ化についても検討しなくてはならない時期になっている。
::テキストデータ化については、OCRの認識率が課題としてよく知られているが、それ以外にも誤読の問題、提供するフォーマットの問題、記述方式の問題、図や写真などの文字情報以外のコンテンツに対する説明をどうするかなど様々な課題が存在する。今回は、プリントディスアビリティのある人のための録音図書の製作でどのような配慮がされ、それをふまえて、資料のテキストデータ化について、どのような課題があるか整理し、今後とるべき方策について考えたい。
===<span id="mkonaga">「図書館の未来を拓くオープンソースのLSP “FOLIO”」(古永 誠)</span>===
::この度、複数の図書館・サービスプロバイダによる新しい協同イニシアチブ"FOLIO"が発足しました。FOLIO は"Future of Libraries is Open"を意味し、図書館やサービスプロバイダ、そしてその他関連機関が連携・交流し、開かれた環境のもと、今後求められる新しい機能要件を備えたオープンソースの次世代型図書館システム(ライブラリ・サービス・プラットフォーム:LSP)の開発を主な使命としています。図書館の新たな可能性を探ると共に、関連技術の更なる発展を目指しています。そしてそこから、新しい図書館サービスや技術革新の創出に繋がる交流・パートナーシップが育まれることを願っています。当日は、FOLIOの概念と機能開発、今後の予定等について、その概要をご説明します。
===<span id="yryuuji">「カーリル Unitrad APIの設計/新しいAPIを設計するためにカーリルが取り組んだこと」(Ryuuji Yoshimoto)</span>===
::カーリルが提供する業務用の高速横断検索APIの開発にあたって、カーリルが考えたことやそのプロセスを題材に、新しいAPIの設計手法を検討する。また設計の過程で発見したキーコンセプトについて具体的な技術を交えながら報告する。
===<span id="kimai">「図書館ビッグデータを「つなげる」書誌情報の名寄せ技術」(今井 敬吾)</span>===
::図書館は膨大なデータやメタデータの宝庫であり、様々な利活用のデザイン・スペースが広がっている。これらを有効活用するには異種のデータを「つなぐ(結合する)」必要があり、機械処理による効率的な方法が期待される。一方、多くのデータは生のテキストそのものとして存在するため、様々なレベルで自然言語処理の応用が不可欠である。発表者は、業務のかたわら様々なデータソースからの書誌情報の統合と分析に従事しているため、実務者としての知見がたまっている。本発表では、n-gram や levenstein距離といった基本的な自然言語処理アルゴリズムを、オープンソースソフトウェアを駆使してどのように書誌情報処理へ適用しているか紹介する。一方、発表者は必ずしも図書館における情報処理に明るいわけではないため、周辺業務に関するベストプラクティスを参加者間で共有できればと考えている。Python 等による初等的なプログラミング知識があればよいが、必須ではない。
===<span id="jkikkawa">「DOI(Digital Object Identifier)入門」(吉川 次郎)</span>===
::近年、論文や研究データなどの多様な学術情報を扱う上で、DOI(Digital Object Identifier、デジタルオブジェクト識別子)がますます重要なものとなっている。日本国内の動向として、JaLC(Japan Link Center)における「研究データ利活用協議会」の発足など、DOI登録のみならず、その利活用を志向する段階に移行しつつあると言える。
::しかし、研究者や図書館関係者にとって、あるいは、学術情報流通やウェブに関心をもつ人々にとって、DOIは「謎のハイパーリンク(あるいは謎の文字列)」というイメージを抱かれていることが少なくないのではないだろうか。DOIは学術情報にアクセスするための恒久的なハイパーリンクとしての機能のみならず、様々な機能を果たす。たとえば、Web APIによる書誌事項の提供を通じたアプリケーションやサービスとの連携や、定量的なアクセス分析のための基盤としての役割をもつ。
::本発表では、「DOIなんて初めて聞いた」、「たまに耳にするけれど、あまり詳しくは知らない」といった人に向けて、実際のサービスや最新動向の紹介を交えながらDOIの基礎知識を共有する。さらに、新たなアイデアの検討やコミュニティの活性化へと繋げることを目指す。


==ショート発表(10件)==
==ショート発表(10件)==

2016年7月29日 (金) 10:17時点における版


基調講演

基調講演(木達 一仁氏(株式会社ミツエーリンクス))「(タイトル未定)」

講演概要
TBA
講演者紹介
宇宙開発関連組織でWebマスターとしての経験を積んだ後、IT業界へ。以後、Webコンテンツの実装工程に多数従事。2004年2月より、株式会社ミツエーリンクスに参加。一時はWeb Standards Project(WaSP)に参加し、Web標準の普及・啓発活動を展開。現在は同社取締役。クライアントワークとしては、主にフロントエンドの設計や実装、関連ガイドラインの策定に従事。ウェブアクセシビリティ基盤委員会(WAIC)副委員長も務める。

Project Next-L

ロング発表(5件)

「プリントディスアビリティのある人のための資料のテキストデータ化、そして、その課題」(安藤 一博)

視覚障害やディスレクシアなど様々な理由で印刷物の利用に困難のある(プリントディスアビリティのある)人のために、図書館はこれまで資料の点字化、音声化(つまり、録音図書の製作)、拡大化など様々な方法によって資料を製作し、提供してきた。そして、近年では、2009年の著作権法の改正や合成音声技術などのICT技術の発達により、資料をテキストデータ化する機関や団体も出てきている。国立国会図書館は、1975年から約40年学術文献の録音図書を製作してきたが、テキストデータ化のメリットを考慮すると、学術文献のテキストデータ化についても検討しなくてはならない時期になっている。
テキストデータ化については、OCRの認識率が課題としてよく知られているが、それ以外にも誤読の問題、提供するフォーマットの問題、記述方式の問題、図や写真などの文字情報以外のコンテンツに対する説明をどうするかなど様々な課題が存在する。今回は、プリントディスアビリティのある人のための録音図書の製作でどのような配慮がされ、それをふまえて、資料のテキストデータ化について、どのような課題があるか整理し、今後とるべき方策について考えたい。

「図書館の未来を拓くオープンソースのLSP “FOLIO”」(古永 誠)

この度、複数の図書館・サービスプロバイダによる新しい協同イニシアチブ"FOLIO"が発足しました。FOLIO は"Future of Libraries is Open"を意味し、図書館やサービスプロバイダ、そしてその他関連機関が連携・交流し、開かれた環境のもと、今後求められる新しい機能要件を備えたオープンソースの次世代型図書館システム(ライブラリ・サービス・プラットフォーム:LSP)の開発を主な使命としています。図書館の新たな可能性を探ると共に、関連技術の更なる発展を目指しています。そしてそこから、新しい図書館サービスや技術革新の創出に繋がる交流・パートナーシップが育まれることを願っています。当日は、FOLIOの概念と機能開発、今後の予定等について、その概要をご説明します。

「カーリル Unitrad APIの設計/新しいAPIを設計するためにカーリルが取り組んだこと」(Ryuuji Yoshimoto)

カーリルが提供する業務用の高速横断検索APIの開発にあたって、カーリルが考えたことやそのプロセスを題材に、新しいAPIの設計手法を検討する。また設計の過程で発見したキーコンセプトについて具体的な技術を交えながら報告する。

「図書館ビッグデータを「つなげる」書誌情報の名寄せ技術」(今井 敬吾)

図書館は膨大なデータやメタデータの宝庫であり、様々な利活用のデザイン・スペースが広がっている。これらを有効活用するには異種のデータを「つなぐ(結合する)」必要があり、機械処理による効率的な方法が期待される。一方、多くのデータは生のテキストそのものとして存在するため、様々なレベルで自然言語処理の応用が不可欠である。発表者は、業務のかたわら様々なデータソースからの書誌情報の統合と分析に従事しているため、実務者としての知見がたまっている。本発表では、n-gram や levenstein距離といった基本的な自然言語処理アルゴリズムを、オープンソースソフトウェアを駆使してどのように書誌情報処理へ適用しているか紹介する。一方、発表者は必ずしも図書館における情報処理に明るいわけではないため、周辺業務に関するベストプラクティスを参加者間で共有できればと考えている。Python 等による初等的なプログラミング知識があればよいが、必須ではない。

「DOI(Digital Object Identifier)入門」(吉川 次郎)

近年、論文や研究データなどの多様な学術情報を扱う上で、DOI(Digital Object Identifier、デジタルオブジェクト識別子)がますます重要なものとなっている。日本国内の動向として、JaLC(Japan Link Center)における「研究データ利活用協議会」の発足など、DOI登録のみならず、その利活用を志向する段階に移行しつつあると言える。
しかし、研究者や図書館関係者にとって、あるいは、学術情報流通やウェブに関心をもつ人々にとって、DOIは「謎のハイパーリンク(あるいは謎の文字列)」というイメージを抱かれていることが少なくないのではないだろうか。DOIは学術情報にアクセスするための恒久的なハイパーリンクとしての機能のみならず、様々な機能を果たす。たとえば、Web APIによる書誌事項の提供を通じたアプリケーションやサービスとの連携や、定量的なアクセス分析のための基盤としての役割をもつ。
本発表では、「DOIなんて初めて聞いた」、「たまに耳にするけれど、あまり詳しくは知らない」といった人に向けて、実際のサービスや最新動向の紹介を交えながらDOIの基礎知識を共有する。さらに、新たなアイデアの検討やコミュニティの活性化へと繋げることを目指す。

ショート発表(10件)

ライトニングトーク