形態素解析(Morphological Analysis)は、人間の言葉をコンピュータに理解させる自然言語処理の1つで与えられたフレーズを名詞、助詞...など、こんな感じで最小単位に分ける解析手法。
現時点で自然言語処理は、形態素解析、構文解析(係り受け解析)、意味解析、文脈解析の順に解析され、その入口に当たるのが形態素解析となっています。
もちろん、全て行う必要はなく、目的に応じて行えば良いでしょう。
MeCab/ChaSen/JUMAN/JUMAN++/KAKASI/Kuromoji/Sudachiなどは日本語の形態素解析のライブラリですが、それぞれ特徴があり、得手不得手はあるようなので目的に応じて使い分けることになるでしょう。
プログラム的に任意の文章からこのような結果を取得できれば、名詞だけを取り出したり、連結したり、ベクトル取得における入力としたり、それらによって新たな知見を得たりすることもできたりするでしょう。