数十年前から断続的に注目されてきたAI(人工知能)の分野において人間の視覚情報の1つとして画像や動画をコンピュータがどのように理解するのかを研究する分野がコンピュータービジョン/Computer Vision。
コンピュータービジョンは、画像や動画上の顔認識や物体検出を行なったり、更にOCRと組み合わせて画像や動画上の文字列を読み取り、可読可能なテキストに変換させることで文字情報を活用したりする一助にもなります。
セキュリティ目的の他、昨今では、コロナ対策による非接触体温計とでも言いましょうか、顔をモニタリングしつつ、体温を測る機器が病院を始め多くの場所で見受けられます。
また、USBカメラ/IPカメラ/各種スキャナ/デジタルカメラ/スマホやタブレットのカメラ/監視カメラ/防犯カメラ等々で撮影することで製品など何らかの分類を行なったり、物体検知による製品検査・チャックを行なったり、動体検知によるビデオ解析や物体の進捗を追ったり、バーコード、QRコードで商品管理や販売管理を行なったり、PDF、レシート、領収書、各種帳票類、名刺などなどプリントアウトされた紙媒体のテキストをデジタルデータとして集計、分析、保存したり、はたまたディープラーニングなど機械学習の入力としたり、抽出したテキストを読み上げたり、そうした機能のない各種の計測器や温度計、湿度計といったものの値を入力値としてスマート機器の制御を行なったり、ログを取ったり、グラフ化したりすることもできるようにもなります。
The 12 Most Popular Computer Vision Tools in 2022によれば、著名なコンピュータービジョンのライブラリ、ソフトウェアには、OpenCV、Viso Suite、TensorFlow、Keras、CUDA、MATLAB、SimpleCV、BroofCV、CAFFE、OpenVINO、DeepFace、YOLO、FastCV、Scikit-imageなどが、更にImage Recognition SoftwareやComputer Vision Softwareなどを見るとまだまだ相当数あるようです。