CFA Level II

【QM】機械学習・ビッグデータプロジェクトについて

フィンテックに関する全般的な知識

フィンテックとは?

  • Fintechとは金融(Financial)とテクノロジー(Technology)を掛け合わせた造語で、新しい金融サービスがテクノロジーとの融合により生み出される潮流のことを指します。
  • Fintechがカバーする領域としては、例えば、莫大なデータ(Big Data)に対する分析や、金融商品の自動売買/提案システム、記録保存に関するサービスが含まれます。
  • Fintechの背景には、技術革新に伴い扱えるデータ量、質、情報源、種類が向上したことが挙げられます。

ビッグデータについて

3つの特徴(3V)

  • Big Data3つの特徴(3つのV)に分類されます。
    Volume(莫大なデータ量を扱う)
    Velocity(リアルタイムに収集される)
    Variety(多様な種類のデータ)

伝統的データと非伝統的データ

  • 得られるデータの種類には、伝統的なデータ非伝統的なデータが存在します。
    伝統的なデータの例は、企業が開示するAnnual Report等です。
    非伝統的なデータの例は、個人、ビジネスプロセス、センサー等から得られるデータです。

構造データと非構造データ

  • Big Dataは様々な情報源から多様なフォーマットで集められます。例えば、SQLテーブルやCSVファイル等の構造データ(Structured), HTML等の準構造データ(Semi-structured)、ビデオメッセージ等の非構造データがあります。

人工知能について

  • Artificial Inteligence(AI)によるコンピューターシステムを用いると人間の知能(またはそれ以上の知能)が行うような高度な業務も対応出来るようになります。
  • 人口知能に関連する、機械学習自然言語処理について見ていきましょう。

機械学習(ML:Machine learning)について

  • 機械学習のコンピュータープログラムは経験を積む度にパフォーマンスが改善していきます。
  • 機械学習のタイプとしては、2種類存在します。
    ①Supervised learning②Unsupervised learningです。

教師あり学習(Supervised learning)

  • ①Supervised learningは、日本語では「教師あり学習」とも呼ばれます。事前に与えられたデータ(例題と正解)から学習を行い、そのパターンやルールを認識して学習することで、結果を汎用化し予測を行います。
  • 過剰適合(Overfitting)とは、機械学習モデルが訓練データを厳密に学び過ぎた結果として発生します。本来学習させたい特徴とは無関係なノイズまでも学習してしまい、訓練データに対する性能は向上するが、それ以外のデータでは逆に結果が悪くなる状態を指します。
  • 教師あり学習の機械学習アルゴリズムには以下があります。
    (1)Prediction (e.g., penalized regression, neural networks)
    (2)Classification (e.g., classification and regression trees, random forests)

教師なし学習(Unsupervised learning)

  • ②Unsupervised learningは、「教師なし学習」と呼ばれ、与えられたデータから学習を行って結果(正解)を出力するのではなく推定や分類の方法、データ自体の構造もコンピュータに学習させます。
  • 教師なし学習の機械学習アルゴリズムには以下があります。
    (1)Clustering algorithms (e.g., K-means algorithm)
    (2)Dimension reduction (e.g., principal component analysis)

自然言語(Natural language)について

  • 自然言語処理(Natural language processing:NLP)では、テキストや音声データを分析・解釈するために、人間が通常用いている言語構造を利用して処理します。
  • テキスト分析(Text Analytics)では、非伝統的な情報(例えば、人間の会話内容等)から世の中の流れを察知し、株価や経済指標の短期的な予測を行います。

ロボ・アドバイザーについて

  • ロボ・アドバイザーサービスは、個人投資家等に対してシステムが自動的に投資アドバイスを行うサービスです。
  • 例えば、資産配分の決定やポートフォリオの最適化、取引執行やリバランス、そして税務戦略等を提案します。一般的にロボ・アドバイザーサービスは保守的なアドバイスを行うと言われています。

アルゴリズムトレードについて

  • アルゴリズムトレーダーは、いつ・どこで・どの程度取引を行うかを事前に定めており、マーケットの状況に応じてプログラムが自動的に取引を行っています。取引スピードは早く、また、取引コストは低く抑えることが出来ます。
  • 金融商品取引所を通さずに投資家の売買注文を電子的につけ合わせるケース(Dark Pool)も増えており、マーケット取引の多様性が進んでいる上、常に新しい情報が価格に反映し続ける国際金融マーケットでは、アルゴリズムトレードはとても重要なツールと認識されています。

ブロックチェーンや分散台帳について

  • ブロックチェーン分散台帳(Distributed ledger technology: DLT)は金融資産を安全に保存・記録し履歴を残す分散ベースの技術です。例えば、仮想通貨やトークン化(物的所有権を電子分散台帳上で記録)を行う際に利用されています。
  • 分散技術によって、証券取引後の複雑で煩雑な処理プロセスを効率的かつリアルタイムで管理する可能性も秘めています。また、コンプライアンスチェック、スマートコントラクトや個人認証時の自動化にも利用可能と言われています。

リスク管理や投資意思決定への応用

  • Big Dataや機械学習を活用することで、リアルタイムにマーケット環境の変化を察知出来るようになります。昨今ではこれら技術をリスク管理や投資意思決定時に利用する傾向が見受けられます。収集したデータをリスク項目と紐付けたり、リスクモデルのインプットとして利用したりと活用されています。