カテゴリー
IT KNOWLEDGE patent

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]
スポンサーリンク
  • by Google Ads ID23293
  • by Google Ads ID:11145
  • by Google Ads ID24747
スポンサーリンク
by Google Ads ID8603

テキストマイニング

テキストマイニングをご存知だろうか? ある長文の文書について、出現する単語の種類・出現頻度・単語同士の関連度・などを統計的に解析して、どのよとうな文書であるのか知る手法である。KH CODERという現在はまだフリーで使用できるソフトウェアがある。

HK CODER Version 3

スポンサーリンク
by Rakuten ID:15895

概況

開発者による活発なセミナーが行われている(2020/3現在)

KH CODER サイト

社会調査のための計量テキスト分析と実践に必要なソフトウェアの開発

目的

使用目的は、色々考えられる。小説の内容について学術的に分類することも可能だろう。

今回、バイオの専門的な特許についてどのような内容が書かれているのか、どのような情報なのかデータマイニングをしたいと考えた。

具体的なアウトプット

具体的なアウトプットとして、キーワードによる検索結果から集めた多数の特許文献から、自分が必要としてい内容が記載された特許を選別するというアウトプットについて考える。

具体的な手順は、以下の通りである。

  1. 多数の実際に特許内容を詳細に確認する前に、まず、このテキストマイニングによって、すべての特許文献を処理する
  2. 解析することで出力される関連図から、出現するワードの頻度と、そのワード間の関連性を理解する
  3. その中から、どの特許文献が、自分にとって必要な情報が記載された特許なのかの基準で選別する
  4. あとは、選別した特許について、詳細に確認していく

使い方

操作方法の概要

  • 新規プロジェクトの作成でファイルを指定する
    • 入力ファイル
      • これまでは、textファイルであった。
      • 2020/03現在、入力ファイルはエクセルになっている
    • エクセルには、1文章1行に整えていく必要があるようだ。
    • 世の中には、PDFファイルが多いし、特許検索サイトで取得できる特許文献のフォーマットは、PDFなので、PDFの入力に対応して欲しいと思う。
  • 前処理
  • 統計結果の表示

使用感

入力した文書の解析結果は、単なる数値の羅列だけではなく連関図などを駆使した出力が多数用意されている。

出現頻度の高い単語は大きなサークルで描かれる。更に、その単語に強く関連する他の単語が線で結ばれる。このような関連性を持つ複数のクラスターとして、一画面に表示される。

スポンサーリンク
by Google Ads ID19417

クラスター間の優劣や、クラスター内の関連性が一目瞭然に把握できる。

感性が騒ぐ感覚になるほど、分析結果を見て驚きを隠せなかった。

編集履歴
2019/12/19 はりきり(Mr)
2020/03/07 追記 (使用感、概況)
2020/07/11 文言整備
2020/12/05 追記 (具体的なアウトプット)
スポンサーリンク
  • by Amaozn ID13196
  • by Amazon ID13211

用語の解説、関連タグ付き投稿の抽出

GNU

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]

patent

[特許関連/記事紹介] 新型コロナウイルスに関する特許の概説記事から – ID15052 [2020/05/02]
[特許] クレーム内容を理解するために文献レビュー —「対象発明の理解を通じたクレーム作成方法の提案、そしてその応用」、パテント (2013),Vol.66, No.13 – / Udemyのオンライン・ビデオ講座 で完結する – ID13101[2020/11/29]
[Patent] アメリカの特許法は2011年からやっと先発明主義から先願主義になった – ID7979 [2020/01/25]
[Data Link] rAAV特許 – アパタイト・クロマト精製法 [工事中] – ID4443 [2019/12/20]
KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]
[Data Link] 特許調査 – ID2577 [2019/10/05]

テキスト

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]

マイニング

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]

特許調査

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]
スポンサーリンク
  • by Google Ads ID24747
  • by Google Ads ID:11145
  • by Google Ads ID23293

Update ID21920

TRIP
[Trip] 新日本海フェリー – 「舞鶴」から「小樽」- さらば大阪 – アラ還は旅立つ – ID29888 [2021/06/13]

Post Views: 7 目次1 新日本海フェリー1.1 部屋1.2 デラックスA和室2 乗船場と「あかしあ」3 船内4 レストラン5 お風呂6 お土産7 まとめ8 編集履歴 新日本海フェリー 近畿から北海道に車を運ぶ […]

BIOLOGICS
[Bio-Process] 配列からベクターDNAを作るまでの概要 – ID16682

Post Views: 0 遺伝子配列からベクターDNAを作る 遺伝子配列 コドン最適化 遺伝子合成 合成遺伝子をベクターにカセットする 大腸菌にトランスフェクションして増やす ampicillin agar plate […]

BIOLOGICS, culture, education
[Bio Edu] Quality by Design – ID29705 [2021/05/11]

Post Views: 0 目次1 Quality by Design2 QbDの全体像3 編集履歴 Quality by Design Quality by Design (QbD)とは、医薬品の開発から始まり、コマー […]

更新された投稿の最新順

スポンサーリンク
by Google Ads ID19417
スポンサーリンク
  • by Amazon ID13339
  • by Amazon ID19245
スポンサーリンク
  • by Google Ads ID:11145
  • by Google Ads ID24747
  • by Google Ads ID23293

最新記事(Knowledge, ID:14684)

KNOWLEDGE
[Kw] Soft Bankの2020年度の最終利益が4.99兆円と発表 – 今、昔を思うこと – 「X68000」という当時は話題となったコンピュータを思い出す – ID29721 [2021/05/12]

Post Views: 12 目次1 Soft Bankで思うこと2 ゲーム3 最後に Soft Bankで思うこと もう35年も前のことです。Soft Bankは書籍を出していました。シャープが開発したApple Co […]

スポンサーリンク
by Google Ads ID19417
KNOWLEDGE, patent
[特許] FTO調査 – 自らの技術が特許侵害していないか – ID15640 [2021/05/07]

Post Views: 15 目次1 FTO調査とは2 均等論2.1 通常の侵害判断2.2 均等論による判断3 5つの要件4 パテントダンス5 参考文献 FTO調査とは FTO (Freedom to Operate) […]

KNOWLEDGE
[教訓] 石橋を叩くかどうか考えている内に、巨人が渡っていった ID25659 [2021/03/31]

Post Views: 22 目次1 石橋を叩いて壊す2 石橋を叩くかどうか考えている内に、巨人が渡っていった 石橋を叩いて壊す 石橋を叩いて壊す、という諺(ことわざ)がありますが、慎重すぎることを、揶揄(やゆ)する言葉 […]

KNOWLEDGE
[Small Town] 大阪城 – 2018年の台風で大きな木々がなぎ倒されていたが、やっと今ではその被害の影は薄れてきた – ID26448 [2021/12/01]

Post Views: 38 目次1 大阪城2 編集履歴 大阪城 大阪城の周辺は、2重の堀があり大阪城公園として整備されています。2018年に上陸した台風によって大きな被害が出ました。我が家の屋根も瓦が破損し雨漏りしたく […]

KNOWLEDGE, security
[サイバー攻撃] 最近のサイバー攻撃対策をCanonのESETソリューションの解説から理解する ID26175 [2020/12/20]

Post Views: 34 目次1 サイバー攻撃2 1. 基本的防御2.1 CanonのESETソリューション3 2. プラスアルファ防御4 事後対策5 予防対策 サイバー攻撃 標的型攻撃 APT(高度で持続的な脅威) […]

KNOWLEDGE
[Kw] 柳田國男と河童 – 民俗学の父 – 遠野物語 – ID26039 [2020/12/16]

Post Views: 35 目次1 はじめに2 柳田國男3 河童 はじめに 「柳田國男」って聞きたことはありますが、恥ずかしながらよく知りませんでした。遠野物語も聞き覚えはありましたが、日本の民俗学の有名な書籍であるこ […]

Page: 1 2 12
スポンサーリンク
  • by Google Ads ID24747
  • by Google Ads ID:11145
  • by Google Ads ID23293

その他記事(ALL-RANDOM, ID:16786)

company, COMPANY-FAVOR, アイロム
気になる企業 – アイロム – ID2664 [2021/02/25]

Post Views: 38 目次1 アイロム (I’ROM) Group1.1 先端医療事業1.2 SMO事業1.3 CRO事業1.4 メディカルサポート事業2 編集履歴 アイロム (I’ROM) Group アイロム […]

スポンサーリンク
by Google Ads ID19417
english
今日の英語 – may vary slightly – 少し変動すると思われます。 – ID24069 [2020/10/06]

Post Views: 30 may vary slightly 少し変動すると思われます。Softwareのupdateが世界的に行われる場合、地域によって、そのupdateの日時が少し「変動」する場合がある。という英 […]

BIOLOGICS, CMO, gene-therapy
気になる企業 ベクタービルダー /デザイン/受託/開発/GMP製造 [2020/11/21] ID24901

Post Views: 37 目次1 VectorBuilder1.1 サイトでできること1.2 ベクターデザインできる種類2 GMP施設 VectorBuilder ベクタービルダー・ジャパンのサイトより。 2015 […]

スポンサーリンク
by Google Ads ID:11143(2)

- 以下のツールに敬意を示します -
Support to AMP (Accelerated Mobile Pages) by official AMP plugin for WordPress, and compatible powered by
Post viewing : Flex Posts - Widget and Gutenberg Block