カテゴリー
IT KNOWLEDGE patent

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]
スポンサーリンク
  • by Google Ads ID:11145
  • by Google Ads ID24747
  • by Google Ads ID23293
スポンサーリンク
by Google Ads ID8603

テキストマイニング

テキストマイニングをご存知だろうか? ある長文の文書について、出現する単語の種類・出現頻度・単語同士の関連度・などを統計的に解析して、どのよとうな文書であるのか知る手法である。KH CODERという現在はまだフリーで使用できるソフトウェアがある。

スポンサーリンク
by Google Ads ID8603

HK CODER Version 3

スポンサーリンク
by Rakuten ID:15895

スポンサーリンク
by Google Ads ID8603

概況

開発者による活発なセミナーが行われている(2020/3現在)

スポンサーリンク
by Google Ads ID19417

KH CODER サイト

社会調査のための計量テキスト分析と実践に必要なソフトウェアの開発

目的

使用目的は、色々考えられる。小説の内容について学術的に分類することも可能だろう。

今回、バイオの専門的な特許についてどのような内容が書かれているのか、どのような情報なのかデータマイニングをしたいと考えた。

具体的なアウトプット

具体的なアウトプットとして、キーワードによる検索結果から集めた多数の特許文献から、自分が必要としてい内容が記載された特許を選別するというアウトプットについて考える。

具体的な手順は、以下の通りである。

  1. 多数の実際に特許内容を詳細に確認する前に、まず、このテキストマイニングによって、すべての特許文献を処理する
  2. 解析することで出力される関連図から、出現するワードの頻度と、そのワード間の関連性を理解する
  3. その中から、どの特許文献が、自分にとって必要な情報が記載された特許なのかの基準で選別する
  4. あとは、選別した特許について、詳細に確認していく

使い方

操作方法の概要

  • 新規プロジェクトの作成でファイルを指定する
    • 入力ファイル
      • これまでは、textファイルであった。
      • 2020/03現在、入力ファイルはエクセルになっている
    • エクセルには、1文章1行に整えていく必要があるようだ。
    • 世の中には、PDFファイルが多いし、特許検索サイトで取得できる特許文献のフォーマットは、PDFなので、PDFの入力に対応して欲しいと思う。
  • 前処理
  • 統計結果の表示
スポンサーリンク
by Google Ads ID8603

使用感

入力した文書の解析結果は、単なる数値の羅列だけではなく連関図などを駆使した出力が多数用意されている。

出現頻度の高い単語は大きなサークルで描かれる。更に、その単語に強く関連する他の単語が線で結ばれる。このような関連性を持つ複数のクラスターとして、一画面に表示される。

クラスター間の優劣や、クラスター内の関連性が一目瞭然に把握できる。

感性が騒ぐ感覚になるほど、分析結果を見て驚きを隠せなかった。

編集履歴
2019/12/19 はりきり(Mr)
2020/03/07 追記 (使用感、概況)
2020/07/11 文言整備
2020/12/05 追記 (具体的なアウトプット)
スポンサーリンク
  • by Amazon ID13339
  • by Amazon ID13211

用語の解説、関連タグ付き投稿の抽出

GNU

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]

patent

[特許関連/記事紹介] 新型コロナウイルスに関する特許の概説記事から – ID15052 [2020/05/02]
[特許] クレーム内容を理解するために文献レビュー —「対象発明の理解を通じたクレーム作成方法の提案、そしてその応用」、パテント (2013),Vol.66, No.13 – / Udemyのオンライン・ビデオ講座 で完結する – ID13101[2020/11/29]
[Patent] アメリカの特許法は2011年からやっと先発明主義から先願主義になった – ID7979 [2020/01/25]
[Data Link] rAAV特許 – アパタイト・クロマト精製法 [工事中] – ID4443 [2019/12/20]
KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]
[Data Link] 特許調査 – ID2577 [2019/10/05]

テキスト

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]

マイニング

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]

特許調査

KH CODER – テキストマイニング – 特許文献の内容を短時間で理解するために使う – ID4553 [2020/12/05]
スポンサーリンク
  • by Google Ads ID24747
  • by Google Ads ID:11145
  • by Google Ads ID23293
スポンサーリンク
by Google Ads ID8603

Update ID21920

hotel, TRIP
[Hotel] クロスホテル – 僕が知っている昔のビジネスホテルとは全く違っていた! – ID29361 [2021/04/18]

Post Views: 6 目次1 クロスホテル2 駐車場3 外観とエントランス4 ロビー5 部屋からの眺め6 食事6.1 ホテル内・ティーラウンジ バルテール7 ツーベッドの部屋8 ダブルベッドの部屋9 大浴場10 ま […]

cafe, gourmet, LIFE, town
[Life] T-SITE in HirakataでWordPress/ blogのメンテ – ID2937 [2019/11/05]

Post Views: 19 目次1 T-SITE2 特徴あるデザインのT-SITE3 TSUTAYAとSTAR BUCKS4 Grounds Baker5 JIN DIN ROU5.1 飲茶定食5.2 その他6 編集履 […]

スポンサーリンク
by Google Ads ID19417

更新された投稿の最新順

スポンサーリンク
  • by Amazon ID19245
  • by Amaozn ID13196
スポンサーリンク
  • by Google Ads ID:11145
  • by Google Ads ID23293
  • by Google Ads ID24747
スポンサーリンク
by Google Ads ID8603

最新記事(Knowledge, ID:14684)

BIOLOGICS, KNOWLEDGE
[Bio-Edu] 医薬品開発における申請 – 諸手続き – 工事中 – SM-ID25710 [2020/12/10]

このコンテンツを閲覧するにはログインが必要です。お願い ログイン. あなたは会員ですか ? 会員について

KNOWLEDGE
[Kw] Soft Bankの2020年度の最終利益が4.99兆円と発表 – 今、昔を思うこと – ID29721 [2021/05/12]

Post Views: 1 Soft Bankで思うこと もう35年も前のことです。Soft Bankは書籍を出していました。シャープが開発したApple Computerを目指す意欲的なPC、X68000です。Soft […]

スポンサーリンク
by Google Ads ID19417
KNOWLEDGE, patent
[特許] FTO調査 – 自らの技術が特許侵害していないか – ID15640 [2021/05/07]

Post Views: 3 目次1 FTO調査とは2 均等論2.1 通常の侵害判断2.2 均等論による判断3 5つの要件4 パテントダンス5 参考文献 FTO調査とは FTO (Freedom to Operate) 調 […]

KNOWLEDGE
[教訓] 石橋を叩くかどうか考えている内に、巨人が渡っていった ID25659 [2021/03/31]

Post Views: 13 目次1 石橋を叩いて壊す2 石橋を叩くかどうか考えている内に、巨人が渡っていった 石橋を叩いて壊す 石橋を叩いて壊す、という諺(ことわざ)がありますが、慎重すぎることを、揶揄(やゆ)する言葉 […]

KNOWLEDGE
[Small Town] 大阪城 – 2018年の台風で大きな木々がなぎ倒されていたが、やっと今ではその被害の影は薄れてきた – ID26448 [2021/12/01]

Post Views: 30 目次1 大阪城2 編集履歴 大阪城 大阪城の周辺は、2重の堀があり大阪城公園として整備されています。2018年に上陸した台風によって大きな被害が出ました。我が家の屋根も瓦が破損し雨漏りしたく […]

KNOWLEDGE, security
[サイバー攻撃] 最近のサイバー攻撃対策をCanonのESETソリューションの解説から理解する ID26175 [2020/12/20]

Post Views: 27 目次1 サイバー攻撃2 1. 基本的防御2.1 CanonのESETソリューション3 2. プラスアルファ防御4 事後対策5 予防対策 サイバー攻撃 標的型攻撃 APT(高度で持続的な脅威) […]

Page: 1 2 12
スポンサーリンク
  • by Google Ads ID24747
  • by Google Ads ID23293
  • by Google Ads ID:11145
スポンサーリンク
by Google Ads ID8603

その他記事(ALL-RANDOM, ID:16786)

BIOLOGICS, medicine
[医薬品] ウロキナーゼ – ID18306 [2020/06/29]

Post Views: 23 目次1 ウロキナーゼ2 薬価 ウロキナーゼ 一般名 ウロキナーゼ; Urokinase 構造 1本鎖(14SS結合) 薬価 一般名 ウロキナーゼ; Urokinase 分子量 54kDa 効 […]

スポンサーリンク
by Google Ads ID19417
Finance, key-word, KNOWLEDGE
[用語] TOB; Take Over Bid ; 株式公開買付 – ID21333 [2020/08/17]

Post Views: 30 TOB TOB; Take Over Bid; 株式公開買付、敵対的買収にも使われる 企業買収の中心的な手段。 公開企業の支配権・経営権の取得を目的に有価証券市場ではなく短期の期限を定めて株 […]

plugin, Synology, WordPress
[WordPress] Cool Timeline プラグイン – ID10768 [2020/02/25]

Post Views: 23 編集履歴 2020/02/25 Mr.HARIKIRI 2020/12/06 文言整備

スポンサーリンク
by Google Ads ID:11143(2)

- 以下のツールに敬意を示します -
Support to AMP (Accelerated Mobile Pages) by official AMP plugin for WordPress, and compatible powered by
Post viewing : Flex Posts - Widget and Gutenberg Block