カテゴリー
IT KNOWLEDGE patent

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]
スポンサーリンク
  • by Google Ads ID:11145
  • by Google Ads ID23293
  • by Google Ads ID24747
スポンサーリンク
by Google Ads ID8603

テキストマイニング

テキストマイニングをご存知だろうか? ある長文の文書について、出現する単語の種類・出現頻度・単語同士の関連度・などを統計的に解析して、どのよとうな文書であるのか知る手法である。KH CODERという現在はまだフリーで使用できるソフトウェアがある。

HK CODER Version 3

スポンサーリンク
by Rakuten ID:15895

概況

開発者による活発なセミナーが行われている(2020/3現在)

KH CODER サイト

社会調査のための計量テキスト分析と実践に必要なソフトウェアの開発

目的

使用目的は、色々考えられる。小説の内容について学術的に分類することも可能だろう。

今回、バイオの専門的な特許についてどのような内容が書かれているのか、どのような情報なのかデータマイニングをしたいと考えた。

スポンサーリンク
by Google Ads ID19417

具体的なアウトプット

具体的なアウトプットとして、キーワードによる検索結果から集めた多数の特許文献から、自分が必要としてい内容が記載された特許を選別するというアウトプットについて考える。

具体的な手順は、以下の通りである。

  1. 多数の実際に特許内容を詳細に確認する前に、まず、このテキストマイニングによって、すべての特許文献を処理する
  2. 解析することで出力される関連図から、出現するワードの頻度と、そのワード間の関連性を理解する
  3. その中から、どの特許文献が、自分にとって必要な情報が記載された特許なのかの基準で選別する
  4. あとは、選別した特許について、詳細に確認していく

使い方

操作方法の概要

  • 新規プロジェクトの作成でファイルを指定する
    • 入力ファイル
      • これまでは、textファイルであった。
      • 2020/03現在、入力ファイルはエクセルになっている
    • エクセルには、1文章1行に整えていく必要があるようだ。
    • 世の中には、PDFファイルが多いし、特許検索サイトで取得できる特許文献のフォーマットは、PDFなので、PDFの入力に対応して欲しいと思う。
  • 前処理
  • 統計結果の表示

使用感

入力した文書の解析結果は、単なる数値の羅列だけではなく連関図などを駆使した出力が多数用意されている。

出現頻度の高い単語は大きなサークルで描かれる。更に、その単語に強く関連する他の単語が線で結ばれる。このような関連性を持つ複数のクラスターとして、一画面に表示される。

クラスター間の優劣や、クラスター内の関連性が一目瞭然に把握できる。

感性が騒ぐ感覚になるほど、分析結果を見て驚きを隠せなかった。

編集履歴
2019/12/19 はりきり(Mr)
2020/03/07 追記 (使用感、概況)
2020/07/11 文言整備
2020/12/05 追記 (具体的なアウトプット)
スポンサーリンク
  • by Amazon ID19245
  • by Amazon ID13339

用語の解説、関連タグ付き投稿の抽出

GNU

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]

patent

[特許関連/記事紹介] 新型コロナウイルスに関する特許の概説記事から – ID15052 [2020/05/02]
[特許] クレーム内容を理解するために文献レビュー —「対象発明の理解を通じたクレーム作成方法の提案、そしてその応用」、パテント (2013),Vol.66, No.13 – / Udemyのオンライン・ビデオ講座 で完結する – ID13101[2020/11/29]
[Patent] アメリカの特許法は2011年からやっと先発明主義から先願主義になった – ID7979 [2020/01/25]
[Data Link] rAAV特許 – アパタイト・クロマト精製法 [工事中] – ID4443 [2019/12/20]
KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]
[Data Link] 特許調査 – ID2577 [2019/10/05]

テキスト

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]

マイニング

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]

特許調査

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]
スポンサーリンク
  • by Google Ads ID24747
  • by Google Ads ID23293
  • by Google Ads ID:11145

Update ID21920

HEALTH, kidney
[健康] 血中クレアチニン(Cr)濃度とeGFR /関連表の理解と腎機能の閾値 – 水分の摂取量でクレアチニンを下げれるかも(只今実験中: 初回結果) – eGFRはCr/年齢/性別で計算

Post Views: 50 ID27337, [2021/09/06] 目次1 はじめに2 クレアチニン(Cr)とは2.1 クレアチンの成分2.2 筋肉内での反腕と筋肉の収縮運動2.3 クレアチニン(Cr)濃度が高い2 […]

HEALTH
[COVID-19] pfizerに続いて、modernaとAstrazenecaのワクチンが承認 – ID30044 [2021/09/19]

Post Views: 26 目次1 日本で承認されたCOVID-19ワクチン2 日本の企業による開発状況3 武田製薬はmodernとNovavaxと提携4 編集履歴 日本で承認されたCOVID-19ワクチン 今日(20 […]

スポンサーリンク
by Google Ads ID19417
BIOLOGICS, education, production
[Bio-Edu] タンパク質サンプルを得るまでのフローと装置 : 培養→精製→分析→保管 – ID9802 [2019/12/08]

Post Views: 48 目次1 原材料2 USP(培養)3 DSP(精製)4 分析5 保管 原材料 タンパク質の原材料 : 以下の記事に詳細があります。 USP(培養) バイオロジクスではUp Stream Pro […]

更新された投稿の最新順

スポンサーリンク
  • by Amazon ID13211
  • by Amaozn ID13196
スポンサーリンク
  • by Google Ads ID24747
  • by Google Ads ID:11145
  • by Google Ads ID23293

最新記事(Knowledge, ID:14684)

KNOWLEDGE
[Kw] – コンサルティング会社 – まとめ中

Post Views: 2 ID30760 [2021/09/014] コンサルティング会社 経営コンサルティング会社は、やはり欧米です。 マッキンゼー・アンド・カンパニー (McKinzey & Company […]

スポンサーリンク
by Google Ads ID19417
KNOWLEDGE
[Kw] Soft Bankの2020年度の最終利益が4.99兆円と発表 – 今、昔を思うこと – 「X68000」という当時は話題となったコンピュータを思い出す – ID29721 [2021/05/12]

Post Views: 26 目次1 Soft Bankで思うこと2 ゲーム3 最後に Soft Bankで思うこと もう35年も前のことです。Soft Bankは書籍を出していました。シャープが開発したApple Co […]

KNOWLEDGE, patent
[特許] FTO調査 – 自らの技術が特許侵害していないか – ID15640 [2021/05/07]

Post Views: 30 目次1 FTO調査とは2 均等論2.1 通常の侵害判断2.2 均等論による判断3 5つの要件4 パテントダンス5 参考文献 FTO調査とは FTO (Freedom to Operate) […]

KNOWLEDGE
[教訓] 石橋を叩くかどうか考えている内に、巨人が渡っていった ID25659 [2021/03/31]

Post Views: 38 目次1 石橋を叩いて壊す2 石橋を叩くかどうか考えている内に、巨人が渡っていった 石橋を叩いて壊す 石橋を叩いて壊す、という諺(ことわざ)がありますが、慎重すぎることを、揶揄(やゆ)する言葉 […]

KNOWLEDGE
[Small Town] 大阪城 – 2018年の台風で大きな木々がなぎ倒されていたが、やっと今ではその被害の影は薄れてきた – ID26448 [2021/12/01]

Post Views: 57 目次1 大阪城2 編集履歴 大阪城 大阪城の周辺は、2重の堀があり大阪城公園として整備されています。2018年に上陸した台風によって大きな被害が出ました。我が家の屋根も瓦が破損し雨漏りしたく […]

KNOWLEDGE, security
[サイバー攻撃] 最近のサイバー攻撃対策をCanonのESETソリューションの解説から理解する ID26175 [2020/12/20]

Post Views: 50 目次1 サイバー攻撃2 1. 基本的防御2.1 CanonのESETソリューション3 2. プラスアルファ防御3.1 ESETソリューション4 事後対策4.1 ESETソリューション5 予防 […]

Page: 1 2 12
スポンサーリンク
  • by Google Ads ID23293
  • by Google Ads ID:11145
  • by Google Ads ID24747

その他記事(ALL-RANDOM, ID:16786)

LIFE
[Life] 生駒山上遊園地90周年記念 令和元年 ファイヤーイリュージョン (夏花火) – 毎年行っています – ID1208

Post Views: 51 2019/08/08 大阪と奈良の県境による生駒山上遊園地には毎年花火を見に訪れる。今回もまたやってきた。

Gear
[Gear] sanag Bluetooth 円筒形ハンディ スピーカー – ID4979 [2019/12/27]

Post Views: 44 sanag Bluetooth handy speaker JBLを買おうかと思ってAmazonで品定めした結果、ハンディで同じ価格帯からこれを購入しました。 Amazon, ¥3,180 […]

plugin, Synology, WordPress
[WordPress] AMPページ対応の広告プラグイン – Advanced Ads Pro (有料版) – 導入と運用 – ID11202 [2020/12/10]

Post Views: 45 目次1 はじめに2 広告プラグインの導入目的3 Advanced Adsの機能4 AMPとは4.1 AMP プラグイン5 AMP対応広告プラグイン5.1 Advanced Adsプラグイン5 […]

スポンサーリンク
by Google Ads ID19417
スポンサーリンク
by Google Ads ID:11143(2)

- 以下のツールに敬意を示します -
Support to AMP (Accelerated Mobile Pages) by official AMP plugin for WordPress, and compatible powered by
Post viewing : Flex Posts - Widget and Gutenberg Block