この関係グラフは、有価証券報告書に記載された「事業の内容」のテキストを基に、企業間の類似度を算出し可視化したものです。 類似度は、形態素解析(SudachiPy)→ 名詞抽出 → ストップワード除去 → TF-IDF → コサイン類似度 によって求めています。
ノード(点)の色は東証33業種分類に基づいており、異なる色同士が接続している部分に、業種分類と実際の事業内容の類似性の違いが現れます。
この研究はJSPS科研費 23K01705 の助成を受けた研究の一部です.