python PR

pythonで形態素解析エンジンMeCabを使って名詞の出現回数を数える

python mecab 名詞
記事内に商品プロモーションを含む場合があります

pythonで形態素解析エンジンMeCabを使って解析を行なっていると、

あれ?この単語どれくらいの回数使われているんだろう?

一番使われていた名詞ってなんだろう?

などという疑問が出てくると思います

この記事ではpythonで形態素解析エンジンMeCabを使って名詞の出現回数を数える方法について解説していきたいと思います

Pythonで形態素解析エンジンMeCabを使う

pythonでmecabを使う準備

形態素解析は自然言語処理の一種で、文章を最小の単語に分け、さまざまな方法を使って解析することを言います

この形態素解析では、活用形の種類や品詞の特定を行うことができます

pythonで形態素解析を行うことができるものは今回使用する「MeCab」の他に「Janome」や「Juman」「Cabocha」などがあります

それぞれ特徴があり、解析速度に違いもありますが、一般的に使われているのは「MeCab」「Janome」の2つです

Janomeは使用までの手間が少なく、pipでインストールすればすぐに使用可能
MeCabはやや煩雑

Mecabのインストール

pythonで形態素解析を行うために、MeCabをインストールしていきます

https://python-man.club/pythonn_morphological_analysis_mecab/

MeCabを実行する

pythonでMeCabを使用する準備ができたら、MeCabを実行していきます

import MeCab
 
mecab = MeCab.Tagger()
sent ="今日は形態素解析を行なっていく"
print(mecab.parse(sent))

>>>出力結果

今日	名詞,副詞可能,*,*,*,*,今日,キョウ,キョー
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
形態素	名詞,一般,*,*,*,*,形態素,ケイタイソ,ケイタイソ
解析	名詞,サ変接続,*,*,*,*,解析,カイセキ,カイセキ
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
行なっ	動詞,自立,*,*,五段・ワ行促音便,連用タ接続,行なう,オコナッ,オコナッ
て	助詞,接続助詞,*,*,*,*,て,テ,テ
いく	動詞,非自立,*,*,五段・カ行促音便,基本形,いく,イク,イク
EOS

名詞のみ抽出する

MeCabを実行したら、今度は名詞のみを抽出していきたいと思います

あまり短い文章では自力でカウントできてしまうので、今回使用するテキストは首相の会見内容を行っていきます

こちらのページの内容をコピペしてテキストファイルとして保存しておきましょう

import collections
import MeCab


#textファイルの読み込み
#****には保存したtxtファイルのパス名を入れてください
f= open('****.txt', 'r', encoding='UTF-8')
text=f.read()
f.close()

#読み込んだtextファイルで形態素解析を行う
tagger =MeCab.Tagger()
tagger.parse('')
node = tagger.parseToNode(text)

#取り出す品詞を決めている.今回は名詞
word_list=[]
while node:
    word_type = node.feature.split(',')[0]
    #名詞の他にも動詞や形容詞なども追加できる
    if word_type in ["名詞"]:
        word_list.append(node.surface)
    node=node.next
word_chain=' '.join(word_list)

#collections.counterでword_list内に含まれている名詞をカウント
c=collections.Counter(word_list)

#printでよく使われている単語top20を出力
print(c.most_common(20))

>>>出力結果

[('こと', 114), ('の', 68), ('接種', 65), ('0', 60),
 ('1', 52), ('者', 49), ('感染', 48), ('総理', 43),
 ('状況', 43), ('的', 43), ('よう', 41), ('3', 40), 
('日', 38), ('回', 36), ('目', 36), ('対策', 30), 
('お願い', 28), ('対応', 27), ('2', 26), ('方', 24)]

おすすめプログラミングスクール(無料体験あり)

Webスキルのパーソナルジム【WEBCAMP】

WEBCAMPを徹底解説している記事はこちら

pythonコースを利用できるWEBCAMPを徹底解説【無料体験あり】
pythonコースを利用できるWEBCAMPを徹底解説【無料体験あり】pythonを学ぶことができる「WECAMP」ですが、実際はどうなのでしょうか?webcampで本当にpythonを学ぶことができるのか・案件をとることができるのか、などpythonを初めて学ぶ方は不安に思うと思います。そこで、この記事ではpythonを学ぶことができるwebcampについて徹底解説していきます...
AIを学ぶならアイデミープレミアム

アイデミープレミアムを徹底解説している記事はこちら

Python アイデミープレミアム
pythonが学べるアイデミープレミアムを徹底解説【無料体験あり】アイデミープレミアムはpythonに特化したプログラミングスクールです。pythonを学ぼうと思った方は、一度は聞いたことがあるのではないでしょうか。今回はアイデミープレミアムで学ぶことで、エンジニア業界の戦力になれるのか、しっかりとpythonを学ぶことができるのかについて、徹底解説していきます...
pythonコース【テックアカデミー】

テックアカデミーを徹底解説している記事はこちら

pythonが学べるテックアカデミーを徹底解説【無料体験あり】
pythonが学べるテックアカデミーを徹底解説【無料体験あり】今回の記事では、 pythonを扱えるようになりたい pythonを学んでエンジニアになりたい テックアカデミーってよく聞くけ...
おすすめプログラミングスクール

DMMWEBCAMP
  • WEBCAMPはコスパ最強
  • WEBCAMPは初心者に優しい充実したサポート付き
  • 16週間プランを選択して、返金してもらおう
WEBCAMPの公式ページはこちら WEBCAMPの口コミ・評価はこちら
テックアカデミー  
  • テックアカデミーは費用対効果抜群
  • テックアカデミーのサポートは個人の能力に応じつつ、python初心者に優しい
  • まずは無料体験でテックアカデミーを知ってから受講を決める
テックアカデミーの公式ページはこちら テックアカデミーの口コミ・評価はこちら
キカガク
  • 多種多様なスキルコース
  • 初心者から専門家まで対象
  • 給付金利用で費用を抑えられる
キカガクの公式ページはこちら キカガクの口コミ・評価はこちら
Aidemy Premium
  • 完全オンラインで、時間や場所に縛られず学習したい
  • マンツーマン学習サポートにより実践に近い経験をしたい
  • 未経験から機械学習エンジニアになりたい
Aidemy Premiumの公式ページはこちら Aidemy Premiumの口コミ・評価はこちら
My Agile Privacy
This website uses technical and profiling cookies. Clicking on "Accept" authorises all profiling cookies. Clicking on "Refuse" or the X will refuse all profiling cookies. By clicking on "Customise" you can select which profiling cookies to activate.