機械学習って結局何だろう?

機械学習

いまさら学ぶ機械学習

近年、幅広い業種で利用されている機械学習について、知ってはいるが、具体的に説明できるかと言われれば、不安が残る人が多いのではないかと思ったので改めて、機械学習についてまとめてみました。導入から、機械学習の分析モデルの詳細までまとめていければと思います。

学習の背景

今後レシートローラーでは、データ分析に対するソリューションを展開しようとしています。そんな中で、弊社の提供する情報が何を基準にした手法なのか、そして得られた結果はどのような特徴があるのか、ということを皆さんに知ってもらうことで、マーケティングの参考になればと思っています。

機械学習って何?

機械学習いわゆるMachine Learning(ML)とは、簡単に言えば「コンピュータにデータを与えて、自動で学ばせる技術」のことです。そして、この学ばせた知識を使って、予測・判断を行うことができます。コンピュータを使っているため、多くのデータを分析することができ、より正確な予測や、新しい法則を発見することができるようになりました。

人工知能・ディープラーニングと何が違うのか

人工知能(AI)とディープラーニング(DL)、そして機械学習は似ているためその分類を簡単に説明したいと思います。 AIはディープラーニングと機械学習を含む、コンピュータが人間の考える能力や行動を模倣する技術全般を言います。ふわっとした言い方になりますが、そもそも「知能とは」といった定義があいまいなので、これが最大限のAIの表現になります。 機械学習は先ほど述べた通り、「学習」するという特徴を持つAIです。 ディープラーニングは機械学習の中でもニューラルネットワーク(NN)の技術を使って、さらに膨大なデータの分析を行い、高精度な予測や分析を行うもののことを言います。人が発見できないような特徴を見つけることができる可能性がありますが、用意できるデータが少ない場合には十分な学習が行えないため、ほかの機械学習を行うほうが精度が向上する場合があります。 まとめると人工知能(AI)の一部を機械学習(ML)といいさらにその一部がディープラーニングということになります。次の図も参考にしてみてください。

機械学習定義.png

機械学習の仕組み

学習の仕組みには主に3つの種類があり、教師あり学習と教師なし学習,そして強化学習があります。それぞれについて説明していきます。

教師あり学習

あらかじめデータとその答えを用意し、学習させることを言います。例えば、車の画像を読み込ませて、「これは車の画像」ということを判断させたいときには、たくさんの車の画像に車というラベルを付けて学習させます。すると、学習に使用していない、新しく撮影した車の画像でも「これは車です」と判断できるようになります。

教師なし学習

教師あり学習と異なる点は、学習に答えを使用しないという点です。教師あり学習の図にあるラベルを設定せずに学習します。その中から、同じ特徴を持つ画像をグループ分けしていくという方法です。「車」という答えは出てこないのですが、グループ1、グループ2のように分けられ、グループ1には車の画像が入っているということになります。

強化学習

これまでの二つの学習方法とは違い、事前にデータを与えない学習方法です。どういうことかというと、ある一つの結果に向けてシステムを実行していく中で、自ら試行錯誤し、最適な結果を得られるように学習します。例として、ロボットが野球のバッティングでホームランを打つという結果に向けて、学習を行うとしましょう。初めはバットを振ると転ぶ、ボールに当たらないなどの、目的から遠い結果が得られます。このような結果になったときは、マイナスの得点をつけ、ボールを打てた時などは、飛距離によって高い得点をつけるように学習の評価を設定し、より得点が高くなるように学習していきます。この時にはボールの位置や、バットの振りの角度、足の位置などの情報をデータを収集します。これを途方もない回数繰り返し行うことで、ホームランを打てるようになるという仕組みです。実際にこのようなロボットがいるかどうかは見つけられませんでしたが、車の自動運転などは主に強化学習を行っています。

学習モデルの種類

機械学習のモデルとは、入力されたデータから学習したパターンや、関係性を表す数学的な式や構造のことを言います。目的によって、さまざまなモデルを使い分けることで、予測や判別の精度を上げることができます。例えば、売上予測などには線形回帰を使用し、スパムメールの判定などのカテゴリーの分類を行うような場合は、ロジスティック回帰などがあげられます。ほかにも、ディープラーニングに使用するニューラルネットワークや、教師なし学習の代表であるクラスタリングなどがあります。これらのモデルの詳細については、別の記事で触れたいと思います。

機械学習が輝く場所

最近では機械学習は数えきれないほど多くの分野で活躍していますが、一番身近なものは画像認識や音声認識、自然言語処理などでしょうか。具体例を挙げると、自動運転や、Siri、お掃除ロボットなどがあげられます。ほかにこの記事でも述べてきた、顧客分析、需要予測など使用されているものを挙げたらきりがありません。 機械学習は大量のデータを、数学的な根拠に基づいて分析することができます。そのため、決まった数式や方程式が存在せず、大量のデータと変数が含まれる複雑な問題に対して、大きな効力を発揮できます。

さいごに

ReceiptRollerでは電子レシートをはじめとし、様々なソリューションを提供していきます。 今回の機械学習のほかに、OCRについての記事も投稿していますので読んでみてください。

https://qiita.com/y-okada1412/items/4a4a78ffc4cd6a0d7485

レシートOCRは、LINEからどなたでも無料でご利用いただけますので、 ぜひ試してください!

また、OCRのデモ体験がこちらのページからできます!

https://receiptroller.com/ja

参考

公開日: 2023-11-09 更新日: 2023-11-09

岡田勇磨

情報系修士学生で画像処理を中心に研究しています。ITから始まり多分野に興味を持って取り組んでます。