ニュースサイトの本文抽出について
本システムは、金沢工業大学 水野研究室の2011年度卒業研究の一環として作成されました。 今回は試験導入になりますので、是非、あいりぶネットをご利用の皆様のご意見を頂きたく思います。 お気付きの点、ご不満な点等ございましたら、是非
お問い合わせ
ページよりご一報ください。
システムの概要
本システムを利用することにより、ニュースサイトの冗長な項目を除外し、本文のみを抽出することで、 音声ブラウザでのスムーズな読み上げを行うことが可能です。
本システムはニュース一覧の取得に各メディアが配信する
RSS
を利用しているため、 常に最新のニュースを閲覧することが可能です。 よって
RSS
を配信しているサイトであれば、ニュースの一覧に無いものであっても追加することが可能です。 追加してほしいサイト等のご要望がございましたら、「サイト名」、「URL」を書き添えて、
お問い合わせ
のページからご連絡ください。
現在テスト運用であるため、タイプ1とタイプ2の2種類がございます.
タイプ1は記事タイトルが元ページへのリンクになっており、横にある本文表示ボタンを選択することで記事本文のみを表示します。
タイプ2は記事タイトルがリンクになっておらず、横に本文表示ボタン、その横に元ページへのリンクボタンがあります。
その他
RSSというシステムの仕様上、過去の配信ニュースを閲覧することは不可能です。
RSSを配信しているサイトであっても、ページ内容が、画像やFlashを過度に用いたものであったり、 PDF形式のページである場合は本文の抽出に失敗します。また、本文構成があまりにも奇抜な場合も 本文の抽出に失敗する場合があります。ご了承ください。
トップへ戻る
※ "あいりぶネット" に掲載されている文章や、写真などの無断転載を禁じます。
すべての著作権は、石川県視覚障害者情報文化センターに帰属します。
Copyrights (C) 2002-2011 石川県視覚障害者情報文化センター All Rights Reserved.