IT技術を分かりやすく簡潔にまとめることによる学習の効率化、また日常の気付きを記録に残すことを目指します。

Tensorflow 機械学習 (Machine Learning)

tensorflowのmatmulの使い方について（次元別の仕様やnumpy.matmulとの違いを整理）

投稿日：2022年10月8日更新日：2025年1月13日

＜目次＞

(１) tensorflowのmatmulの使い方について（次元別の仕様やnumpy.matmulとの違いを整理）
　(１-１) tensorflow.matmulの次元別の挙動
　 (１-２) tensorflow.matmulの次元別の挙動（詳細）
　(１-３) tensorflow.matmulの次元別の挙動確認に使用したプログラム
　 (１-４) （参考）numpyのmatmulについて

(１) tensorflowのmatmulの使い方について（次元別の仕様やnumpy.matmulとの違いを整理）

(１-１) tensorflow.matmulの次元別の挙動

（表）

次元（行列1＼行列2）	n=1	n=2	n>2
n=1 （例：[1]）	① ・エラー（In[0] and In[1] ndims must be >= 2）	② ・エラー（In[0] and In[1] has different ndims: [2] vs. [2,1]）	③ ・エラー（In[0] ndims must be >= 2）
n=2 （例：[[1],[1]]）	④ ・エラー（In[0] and In[1] has different ndims: [1,2] vs. [2]）	⑤ ・行列の掛け算	⑥ ・最後の2次元の行列をスタックした扱い。・掛け算の考え方はブロードキャスト
n>2 （例：[[[1],[1]],[[1],[1]]]）	⑦ ・エラー（In[1] ndims must be >= 2）	⑧ ・最後の2次元の行列をスタックした扱い。・掛け算の考え方はブロードキャスト	⑨ ・最後の2次元の行列をスタックした扱い。・先頭の次元が同じ場合に限り、対応する要素の行列同士を掛け算

＞目次にもどる

(１-２) tensorflow.matmulの次元別の挙動（詳細）

●①②③④⑦（第１引数or第２引数のいずれかにN=1を含む）

⇒エラーになる。

⇒ただし、同じmatmulでもnumpy.matmulの場合はN=1の場合、計算時にN=2に補って計算してくれます（例：[2]なら[[2]]に変換して計算）。

●⑤「N=2 & N=2」

⇒行列の計算として扱える

●⑥⑧⑨「N≧2 & N>2」の場合

・numpyドキュメントに以下の記述あり（①②③④⑦以外はnumpyもtensorflowも同一挙動のため参考する）

（図１１１）

↓

・最後の2つの次元（例：2×3×3なら「3×3」の部分）の行列の「スタック」（行列を連結）として扱われます。（例）下図の「赤色の3×3」と「緑色の3×3」の2行列が連結された形です。

（図１２０）

↓

・基本的に、対応する要素同士（赤同士、緑同士）を掛け算します（先頭の次元が同じ数字の場合に限る。

⇒（例）2×3×3と3×3×3は掛け合わせ不可

⇒「⑨」に該当

（図１２１）

↓

・ただし、先頭の次元が1の場合（例：1×3×3）の場合は、ブロードキャストされます

⇒（例）行列a_1x2x2の2×2を、行列b_2x2x2の2×2（２個）のそれぞれと掛け合わせ）

⇒「⑥」「⑧」に該当

（図１２２）

↓

・⑥例：a_2d_1x2の「1×2」を、a_3d_2x2x1の「2×1」（２個）と掛け合わせ

・⑧例：a_3d_2x2x1の「2×1」（２個）を、a_2d_1x2の「1×2」と掛け合わせ

・⑨例：a_3d_2x2x1の「2×1」（２個）を、a_3d_2x1x2の「1×2」（２個）と掛け合わせ（対応する行列同士）

（図１３１）

↓

・今までの説明で確認した法則に則っている事を確認

（図１３２）

↓

・⑨補足

「対応する行列同士」が「赤同士、緑同士」である事を実証するため、次の簡単な確認を実施。

⇒図の中段：緑の行列の最後を[1,2,4]に変更すると、緑の行列にのみ影響（最後が[7,7,7]に変化）

⇒図の下段：赤の行列の最後を[1,1,2]に変更すると、緑の行列にのみ影響（最後が7] 7] 7]に変化）

（図１３４）

＞目次にもどる

(１-３) tensorflow.matmulの次元別の挙動確認に使用したプログラム

（テストコード）

import tensorflow as tf
import numpy as np

def main():

    a_1d_2 = np.array([1,2])
    a_2d_1x2 = np.array([[1,2]])
    a_2d_2x1 = np.array([[1],[2]])
    a_3d_2x1x2 = np.array([[[1,2]],[[1,2]]])
    a_3d_2x2x1 = np.array([[[1],[2]],[[1],[2]]])

    # print("①：",tf.matmul(a_1d_2,a_1d_2).numpy())
    # print("②：",tf.matmul(a_1d_2,a_2d_2x1).numpy())
    # print("③：",tf.matmul(a_1d_2,a_3d_2x2x1).numpy())
    # print("④：",tf.matmul(a_2d_1x2,a_1d_2).numpy())
    # print("⑦：",tf.matmul(a_3d_2x1x2,a_1d_2).numpy())
    print("⑤：",tf.matmul(a_2d_1x2,a_2d_2x1).numpy())
    print("⑥：",tf.matmul(a_2d_1x2,a_3d_2x2x1).numpy())
    print("⑧：",tf.matmul(a_3d_2x2x1,a_2d_1x2).numpy())
    print("⑨：",tf.matmul(a_3d_2x2x1,a_3d_2x1x2).numpy())

if __name__ == "__main__":
    main()

＞目次にもどる

(１-４) （参考）numpyのmatmulについて

・matmulはtensorflowのみならずnumpyにも同一名称の関数がありますが、少し挙動が異なります。

・①②③④⑦はエラーにせず、次元を補う事で内積計算を可能にしています。

（表）

次元（行列1＼行列2）	n=1	n=2	n>2
n=1 （例：[1]）	① ・ベクトルの内積	② ・ベクトルの内積（の繰り返し） ⇒第１引数行列と第２引数列の最初の次元の内積を取る	③ ・ベクトルの内積（の繰り返し） ⇒第１引数行列と第２引数列の最初の次元の内積を取る
n=2 （例：[[1],[1]]）	④ ・ベクトルの内積（の繰り返し） ⇒第１引数行列の最後の次元と第２引数列の内積を取る	⑤ ・行列の掛け算	⑥ ・最後の2次元の行列をスタックした扱い。・掛け算の考え方はブロードキャスト
n>2 （例：[[[1],[1]],[[1],[1]]]）	⑦ ・ベクトルの内積（の繰り返し） ⇒第１引数行列の最後の次元と第２引数列の内積を取る	⑧ ・最後の2次元の行列をスタックした扱い。・掛け算の考え方はブロードキャスト	⑨ ・最後の2次元の行列をスタックした扱い。・先頭の次元が同じ場合に限り、対応する要素の行列同士を掛け算

＞目次にもどる

-Tensorflow, 機械学習 (Machine Learning)

執筆者：RainbowEngine

comment コメントをキャンセル

関連記事

: 最尤推定の計算を正規分布で行った例をご紹介

＜目次＞ (１) 最尤推定の計算を正規分布で行った例をご紹介　(１-１) 最尤推定とは？　(１-２) 最尤推定の計算の流れ　(１-３) STEP1：分布の種類を仮定（例：正規分布、 …

: Kerasで「AttributeError: ‘Sequential’ object has no attribute ‘XXX’」エラー原因・対処（＋predict_classes関数やpredict_proba関数の解説）

＜目次＞ (１) Kerasで「AttributeError: ‘Sequential’ object has no attribute ‘XXX&# …

: ディープラーニングのロジスティクス回帰をPythonで実装した例をご紹介

＜目次＞ (１) ディープラーニングのロジスティック回帰をPythonで実装した例をご紹介　(１-１) 実装のフロー　(１-２) 実装例 (１) ディープラーニングのロジスティック回 …

: numpy.dotの使い方について（次元別の仕様を整理）

＜目次＞ (１) numpy.dotの使い方について（次元別の仕様を整理）　(１-１) numpy.dotの次元別の挙動　(１-２) numpy.dotの次元別の挙動（詳細）　(１ …

: ディープラーニング入門でニューラルネットワークを用いてAND回路を学習させるプログラムをJavaで作成

ニューラルネットワークでAND回路を学習させるJavaプログラムを作成したので、その解説を行います。 (０)目次＆概説 (１) ニューラルネットワークの概要　(１-１) ニューラルネットワークとは？ …

PREV: 確率的勾配降下法（SGD）をロジスティック回帰に適用しPythonで実装した例をご紹介
NEXT: numpy.dotの使い方について（次元別の仕様を整理）

言語 / Language

English (United States)
日本語

検索

人気記事

最新記事

アーカイブ

カテゴリー

Anaplan (2)
Apache (11)
ASP.NET (20)
C# (53)
- Xamarin (4)
C++ (32)
- Valgrind (5)
Cisco (1)
CPU (1)
Database (データベース) (5)
- SQL (2)
GitHub (12)
HTML/css (5)
IT技術 (Technology) (90)
Java (133)
- Eclipse (15)
- JFreeChart (3)
- JSP/Servlet (47)
JavaScript (23)
- jQuery (5)
JP1 (1)
Linux (41)
- CentOS (18)
Microsoft (65)
- Azure (50)
- Azure DevOps (2)
- Yammer (1)
Nginx (2)
OpenAI (4)
OracleDB (26)
PL/SQL (2)
Pleasanter (5)
Powershell (9)
Python (56)
- OpenCV (1)
- Pandas (6)
ShellScript (4)
Slack (6)
SQLServer (12)
Tomcat (21)
TortoiseSVN (7)
VB.NET (2)
VBA (13)
VisualStudio (7)
Windows Server (18)
- Hyper-V (1)
WordPress (5)
つみたてNISA (4)
コボット (1)
スキャナ技術 (Scanner) (1)
ドメイン (Domain) (6)
ネットワーク (Network) (19)
ノートパソコン (15)
- モバイルバッテリー (9)
- 電源カフェ (6)
バッチ処理 (Batch Scripts) (14)
パフォーマンスモニタ (Performance Monitor) (3)
ブレインテック (2)
レンタルサーバ (7)
作業効率化 (1)
動画編集 (2)
- AviUtl (1)
日常 (Daily Life) (64)
- ディズニー (Disney) (2)
- 旅行 (Travel) (13)
- 睡眠 (Sleep) (3)
- 結婚式 (Wedding) (1)
- 美容・健康 (Beauty&Health) (28)
未分類 (2)
機械学習 (Machine Learning) (25)
- Keras (3)
- Tensorflow (3)
英語 (English) (1)
財務会計 (Financial Accounting) (16)

Top