numpy.dotの使い方について（次元別の仕様を整理）

投稿日：2022年10月10日更新日：2023年11月5日

＜目次＞

(１) numpy.dotの使い方について（次元別の仕様を整理）
　(１-１) numpy.dotの次元別の挙動
　 (１-２) numpy.dotの次元別の挙動（詳細）
　(１-３) numpy.dotの次元別の挙動確認に使用したプログラム

(１) numpy.dotの使い方について（次元別の仕様を整理）

(１-１) numpy.dotの次元別の挙動

（表）

次元（行列1＼行列2）	n=1	n=2	n>2
n=1 （例：[1]）	① ・ベクトルの内積	② ・ベクトルの内積（の繰り返し） ⇒第１引数行列と第２引数列の最初の次元の内積を取る	③ ・ベクトルの内積（の繰り返し） ⇒第１引数行列と第２引数列の最初の次元の内積を取る
n=2 （例：[[1],[1]]）	④ ・ベクトルの内積（の繰り返し） ⇒第１引数行列の最後の次元と第２引数列の内積を取る	⑤ ・行列の掛け算	⑥ ・ベクトルの内積（の繰り返し） ⇒「第１引数行列の最後の次元」と「第２引数列の最後から２番目の次元」の内積を取る
n>2 （例：[[[1],[1]],[[1],[1]]]）	⑦ ・ベクトルの内積（の繰り返し） ⇒第１引数行列の最後の次元と第２引数列の内積を取る	⑧ ・ベクトルの内積（の繰り返し） ⇒「第１引数行列の最後の次元」と「第２引数列の最後から２番目の次元」の内積を取る	⑨ ・ベクトルの内積（の繰り返し） ⇒「第１引数行列の最後の次元」と「第２引数列の最後から２番目の次元」の内積を取る

＞目次にもどる

(１-２) numpy.dotの次元別の挙動（詳細）

●④⑦（第１引数はN>1、第2引数はN=1）

⇒「第１引数行列の『最後の次元』」（例：1×2×3なら『3』の部分）と「第２引数列」（例：3）の「内積」を取る

（説明）

・numpyのドキュメントには次の記載あり。

（図１３３①）

・例えば、以下のような行列を考えます。

（図１３３②）

↓

・この時、文中の「sum product of last axis of a and b」は上図で言う、「第１引数行列の『最後の次元』（つまり1×2なら『2』の部分、1×2×3なら『3』の部分）と第２引数列の内積を取る」という意味です。

↓

・④イメージ

（図１３３③）

・⑦イメージ

（図１３３④）

↓

・④⑦例

（図１３３⑤）

●②③（第１引数はN=1、第2引数はN>1）

⇒④⑦の逆パターン。「第１引数行列」（例：2）と「第２引数列の『最初の次元』」（例：2×1なら『2』の部分）の「内積」を取る

・②③例

（図１３１）

●⑤「N=2 & N=2」

⇒行列の計算として扱える

●⑥⑧⑨「N≧2＆N≧2」

⇒「第１引数行列の『最後の次元』」（例：1×2×3の『3』部分）と「第２引数列の『最後から２番目の次元』」（例：2×3×4の『4』部分）の「内積」を取る

（説明）

・numpyのドキュメントには次の記載あり

（図１３４①）

・・・むずい。。

↓

・例えば、以下のような行列を考えます。

（図１３４②）

↓

・先程と同様「sum product over the last axis of a and the second-to-last axis of b」は図で言う「第１引数行列の『最後の次元』（3×3×4の『4』）と第２引数列の『最後から2番目の次元』（2×4×2の『2』）の内積を取る」という意味。

（図１３４③）

↓

・この内積計算により、第２引数列の『最後から2番目の次元』（2×4×2の『2』）は消失します。

（図１３４⑤）

↓

・この内積計算を繰り返すと、次のような形になる。

（図１３４⑥）

↓

・つまり、結果として次のように計算される。

（図１３４⑦）

（図１３４⑧）

↓

・今までの説明で確認した法則に則っている事を確認

（図１３４⑨）

●（備考）

いずれの場合も共通して、行列（k,l）×行列（m,n）において「l列」と「m行」が一致していないと下記のエラーになる。

（例）ValueError: shapes (2,) and (2,1,2) not aligned

＞目次にもどる

(１-３) numpy.dotの次元別の挙動確認に使用したプログラム

import tensorflow as tf
import numpy as np

def main():

    a_1d_2 = np.array([1,2])
    a_2d_1x2 = np.array([[1,2]])
    a_2d_2x1 = np.array([[1],[2]])
    a_3d_2x1x2 = np.array([[[1,2]],[[1,2]]])
    a_3d_2x2x1 = np.array([[[1],[2]],[[1],[2]]])

    print("①：",np.dot(a_1d_2,a_1d_2))
    print("②：",np.dot(a_1d_2,a_2d_2x1))
    print("③：",np.dot(a_1d_2,a_3d_2x2x1))
    print("④：",np.dot(a_2d_1x2,a_1d_2))
    print("⑤：",np.dot(a_2d_1x2,a_2d_2x1))
    print("⑦：",np.dot(a_3d_2x1x2,a_1d_2))
    print("⑥：",np.dot(a_2d_1x2,a_3d_2x2x1))
    print("⑧：",np.dot(a_3d_2x2x1,a_2d_1x2))
    print("⑨：",np.dot(a_3d_2x2x1,a_3d_2x1x2))

if __name__ == "__main__":
    main()

＞目次にもどる