<目次>
(1) Base64のプログラムのサンプル(C++言語)と解説
(1-1) Base64とは?
(1-2) Base64のプログラム例(C++)
(1) Base64のプログラムのサンプル(C++言語)と解説
(1-1) Base64とは?
⇒(参考)Base64とは?概要やアルゴリズムについてご紹介
(1-2) Base64のプログラム例(C++)
(メソッド概要)
| base64_encode | ・引数でエンコード対象の文字列とその長さを受け取る ・while文で文字をループ ∟3文字読み込んだら、そのセットでエンコード処理を実施(4文字に変換) ∟変換後の結果(4文字)を結果用の変数に格納 ・最後の3文字セットが作れない端数部分のデコード処理があれば実行 |
| base64_decode | ・引数でエンコード結果を受け取る ・while文で文字をループ ∟4文字読み込んだら、そのセットでデコード処理を実施(3文字に変換) ∟変換後の結果(3文字)を結果用の変数に格納 ・最後の4文字セットが作れない端数部分のデコード処理があれば実行 |
| main | テスト用のmainメソッド |
(サンプル)
/*
・本ソースコードは下記サイトより引用しています。
(変数:base64_chars、メソッド:base64_encode、base64_decode)
https://renenyffenegger.ch/notes/development/Base64/Encoding-and-decoding-base-64-with-cpp/index#cpp-base64-h
・コメントについては全て"rainbow-engine.com"にて追記をしています。
・テスト用のmainメソッドについては"rainbow-engine.com"にて作成をしています。
*/
#include <iostream>
#include <sstream>
using namespace std;
static const string base64_chars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
static inline bool is_base64(unsigned char c) {
return (isalnum(c) || (c == '+') || (c == '/'));
}
//# エンコードメソッド
//# 第一引数: Base64のエンコード対象の文字列
//# 第二引数: Base64のエンコード対象の文字列の長さ
string base64_encode(unsigned char const* bytes_to_encode, unsigned int in_len) {
//# 結果格納用の変数
string ret;
//# ループ用の変数
int i = 0;
int j = 0;
//# 「_3」はBase64変換前の文字セット(8bit×3=24bit)
//# 「_4」はBase64変換後の文字セット(6bit×4=24bit)
unsigned char char_array_3[3];
unsigned char char_array_4[4];
//# 入力文字列の文字数だけwhileで繰り返す(in_len--)
while (in_len--) {
//# Base64変換前の文字セット(8bit×3=24bit)に、入力の文字を1文字格納する
char_array_3[i++] = *(bytes_to_encode++);
//# 3の倍数でBase64エンコード変換を実施
if (i == 3) {
//# [00000011] [11112222] [22333333]の形で3バイトを6ビット毎に分割し、4バイトに再格納
//# 「& 0xXX」はマスクで、例えば「0xfc」なら「11111100」で先頭6ビットのみ残して、残りは切り落とす
//# 「>> N」や「<< N」はビットシフト演算子で、ビット内のバイトを右や左にズラします。
//# ⇒詳細は次で紹介する「値出力」版のプログラムを見ると、より理解が深まります。
char_array_4[0] = (char_array_3[0] & 0xfc) >> 2;
char_array_4[1] = ((char_array_3[0] & 0x03) << 4) + ((char_array_3[1] & 0xf0) >> 4);
char_array_4[2] = ((char_array_3[1] & 0x0f) << 2) + ((char_array_3[2] & 0xc0) >> 6);
char_array_4[3] = char_array_3[2] & 0x3f;
//# Base64の変換表に沿って、変換後の文字列を結果変数(ret)に格納
for(i = 0; (i <4) ; i++)
ret += base64_chars[char_array_4[i]];
//# 次の3文字セットのループに移るため、iの値をリセット
i = 0;
}
}
//# while文を抜けて、もし「i」が0でない場合
//# ⇒これ以上3の倍数が作れずに1文字or2文字で余った場合に、この分岐に突入
if (i)
{
//# 端数で3文字に満たない部分はゼロ埋め
for(j = i; j < 3; j++)
char_array_3[j] = '\0';
//# 3の倍数の時と同じ処理(8ビット×3組 →6ビット×4組へ変換 →8ビット×4組へ補完)を実施
char_array_4[0] = (char_array_3[0] & 0xfc) >> 2;
char_array_4[1] = ((char_array_3[0] & 0x03) << 4) + ((char_array_3[1] & 0xf0) >> 4);
char_array_4[2] = ((char_array_3[1] & 0x0f) << 2) + ((char_array_3[2] & 0xc0) >> 6);
char_array_4[3] = char_array_3[2] & 0x3f;
//# Base64の変換表に沿って、変換後の文字列を結果変数(ret)に格納
for (j = 0; (j < i + 1); j++)
ret += base64_chars[char_array_4[j]];
//# 8ビットが全て「0」埋めされているchar_array_4は「'='」で埋める
while((i++ < 3))
ret += '=';
}
return ret;
}
//# デコードメソッド
//# 第一引数: Base64のエンコード結果の文字列
string base64_decode(string const& encoded_string) {
//# エンコード結果の文字列の長さを取得
int in_len = encoded_string.size();
//# ループ用の変数
int i = 0;
int j = 0;
int in_ = 0;
//# 「_4」はBase64変換後のエンコード済み文字セット(6bit×4=24bit)
//# 「_3」はBase64変換前のデコード済み文字セット(8bit×3=24bit)
unsigned char char_array_4[4], char_array_3[3];
//# 結果格納用の変数
string ret;
//# 入力文字列の文字数だけwhileで繰り返す(in_len--) かつ 文字が'='でない場合
while (in_len-- && ( encoded_string[in_] != '=') && is_base64(encoded_string[in_])) {
//# Base64変換後の文字セット(8bit×4=32bit)に、入力の文字を1文字格納する
char_array_4[i++] = encoded_string[in_]; in_++;
//# 4の倍数でBase64のデコード変換を実施
if (i ==4) {
for (i = 0; i <4; i++)
char_array_4[i] = base64_chars.find(char_array_4[i]);
//# エンコード時の逆の処理を実施
char_array_3[0] = (char_array_4[0] << 2) + ((char_array_4[1] & 0x30) >> 4);
char_array_3[1] = ((char_array_4[1] & 0xf) << 4) + ((char_array_4[2] & 0x3c) >> 2);
char_array_3[2] = ((char_array_4[2] & 0x3) << 6) + char_array_4[3];
//# 変換後の文字列を結果変数(ret)に格納
for (i = 0; (i < 3); i++)
ret += char_array_3[i];
//# 次の3文字セットのループに移るため、iの値をリセット
i = 0;
}
}
//# もし「i」が0でない場合で「'='」にぶつかった場合
//# ⇒これ以上4の倍数が作れずに1文字or2文字or3文字で余った場合に、この分岐に突入
if (i) {
for (j = i; j <4; j++)
char_array_4[j] = 0;
for (j = 0; j <4; j++)
char_array_4[j] = base64_chars.find(char_array_4[j]);
//# エンコード時の逆の処理を実施
char_array_3[0] = (char_array_4[0] << 2) + ((char_array_4[1] & 0x30) >> 4);
char_array_3[1] = ((char_array_4[1] & 0xf) << 4) + ((char_array_4[2] & 0x3c) >> 2);
char_array_3[2] = ((char_array_4[2] & 0x3) << 6) + char_array_4[3];
for (j = 0; (j < i - 1); j++) ret += char_array_3[j];
}
return ret;
}
//#################################
//# RainbowPlanet独自追加
//# テスト用のmainメソッド
//# 「unsigned char input_str[]」の値を自由に変えて使って見てください
//#################################
int main(void){
//# 文字列リテラルは「const char[X]」型になる。
//# 更に「unsigned」が付いているため、「unsigned const char[X]」になる
unsigned char input_str[] = "RainbowEngine";
//unsigned char* input_str_ptr = input_str;
int len_str;
//# 文字列の長さを計算
//# [文字列全体の長さ] / [文字列1文字目の長さ]
len_str = sizeof(input_str) / sizeof(input_str[0]);
//# 終端文字(ヌル文字)の除去
len_str -= 1;
cout <<"(1)入力文字列 : "<< input_str << endl;
cout <<"(2)エンコード後文字列 : "<< base64_encode(input_str, len_str)<< endl;
cout <<"(3)デコード後文字列 : "<< base64_decode(base64_encode(input_str, len_str))<< endl;
}
エンコードの例です。「RainbowEngine」を入力し、エンコードすると「UmFpbmJvd0VuZ2luZQ==」になり
その後またデコードして戻すと「RainbowEngine」に戻る事が確認できました。

●値を細かく出力して流れを追う
Base64のエンコード、デコードはビットの「マスク」や「シフト」を多分に用いるため、ソースだけを追っていると非常にイメージしにくい部分があります。そのため、値をcoutやprintして追って見たのが以下のプログラムです。
(サンプル)
/*
・本ソースコードは下記サイトより引用しています。
(変数:base64_chars、メソッド:base64_encode、base64_decode)
https://renenyffenegger.ch/notes/development/Base64/Encoding-and-decoding-base-64-with-cpp/index#cpp-base64-h
・コメントについては全て"rainbow-engine.com"にて追記をしています。
・テスト用のmainメソッドについては"rainbow-engine.com"にて作成をしています。
*/
#include <iostream>
#include <sstream>
#include <bitset>
using namespace std;
static const string base64_chars = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/";
static inline bool is_base64(unsigned char c) {
return (isalnum(c) || (c == '+') || (c == '/'));
}
//# エンコードメソッド
//# 第一引数: Base64のエンコード対象の文字列
//# 第二引数: Base64のエンコード対象の文字列の長さ
string base64_encode(unsigned char const* bytes_to_encode, unsigned int in_len) {
//# 結果格納用の変数
string ret;
//# ループ用の変数
int i = 0;
int j = 0;
//# 「_3」はBase64変換前の文字セット(8bit×3=24bit)
//# 「_4」はBase64変換後の文字セット(6bit×4=24bit)
unsigned char char_array_3[3];
unsigned char char_array_4[4];
//# 入力文字列の文字数だけwhileで繰り返す(in_len--)
while (in_len--) {
cout << "===LOOP:" << in_len << " i=" << i << " char_array_3[" << i << "] : " << *(bytes_to_encode) << endl;
//# Base64変換前の文字セット(8bit×3=24bit)に、入力の文字を1文字格納する
char_array_3[i++] = *(bytes_to_encode++);
//# 3の倍数でBase64エンコード変換を実施
if (i == 3) {
//# char_array_3[0]= 01010010 ⇒1文字目のバイト[R]
//# char_array_3[0] & 0xfc = 01010010 & 11111100(マスク) = 01010000
//# (char_array_3[0] & 0xfc) >> 2 = 00010100 ⇒1文字目のバイトの最初の6ビットを取得し、2ビット右にシフト
char_array_4[0] = (char_array_3[0] & 0xfc) >> 2;
//# 値の出力確認
bitset<8> char_array_4_1(char_array_4[0]);
bitset<8> char_array_3_1(char_array_3[0] & 0xfc); //# 1バイト目の先頭6ビット
cout << "====== char_array_4[0]= " << char_array_4_1 << " char_array_3_1= " << char_array_3_1 << endl;
//# char_array_3[0]= 01010010 ⇒1文字目のバイト[R]
//# char_array_3[0] & 0x03 = 01010010 & 00000011(マスク) = 00000010
//# (char_array_3[0] & 0x03) >> 4 = 00100000 ⇒1文字目のバイトの末尾の2ビットを取得し、4ビット左にシフト
//# char_array_3[1]= 01100001 ⇒2文字目のバイト[a]
//# char_array_3[1] & 0xf0 = 01100001 & 11110000(マスク) = 01100000
//# (char_array_3[1] & 0xf0) >> 4 = 00000110 ⇒2文字目のバイトの最初の4ビットを取得し、4ビット右にシフト
char_array_4[1] = ((char_array_3[0] & 0x03) << 4) + ((char_array_3[1] & 0xf0) >> 4);
//# 値の出力確認
bitset<8> char_array_4_2(char_array_4[1]);
bitset<8> char_array_3_2_1(char_array_3[0] & 0x03); //# 1バイト目の末尾2ビット
bitset<8> char_array_3_2_2(char_array_3[1] & 0xf0); //# 2バイト目の先頭4ビット
cout << "====== char_array_4[1]= " << char_array_4_2 << " char_array_3_2_1= " << char_array_3_2_1 << " char_array_3_2_2= " << char_array_3_2_2 << endl;
//# char_array_3[1]= 01100001 ⇒2文字目のバイト[a]
//# char_array_3[1] & 0x0f = 01100001 & 00001111(マスク) = 00000001
//# (char_array_3[1] & 0x0f) << 2 = 00000100 ⇒2文字目のバイトの末尾の4ビットを取得し、2ビット左にシフト
//# char_array_3[2]= 01101001 ⇒2文字目のバイト[i]
//# char_array_3[2] & 0xc0 = 01101001 & 11000000(マスク) = 01000000
//# (char_array_3[2] & 0xc0) >> 6 = 00000001 ⇒3文字目のバイトの最初の2ビットを取得し、6ビット右にシフト
char_array_4[2] = ((char_array_3[1] & 0x0f) << 2) + ((char_array_3[2] & 0xc0) >> 6);
//# 値の出力確認
bitset<8> char_array_4_3(char_array_4[2]);
bitset<8> char_array_3_3_1(char_array_3[1] & 0x0f); //# 2バイト目の末尾4ビット
bitset<8> char_array_3_3_2(char_array_3[2] & 0xc0); //# 3バイト目の先頭2ビット
cout << "====== char_array_4[2]= " << char_array_4_3 << " char_array_3_3_1= " << char_array_3_3_1 << " char_array_3_3_2= " << char_array_3_3_2 << endl;
//# char_array_3[2]= 01101001 ⇒2文字目のバイト[i]
//# char_array_3[2] & 0x3f = 01101001 & 00111111(マスク) = 00101001
//# char_array_3[2] & 0x3f ⇒3文字目のバイトの末尾の6ビットを取得する
char_array_4[3] = char_array_3[2] & 0x3f;
//# 値の出力確認
bitset<8> char_array_4_4(char_array_4[3]);
cout << "====== char_array_4[3]= " << char_array_4_4 << endl;
//# 変換後の文字列を結果変数(ret)に格納
for(i = 0; (i <4) ; i++)
ret += base64_chars[char_array_4[i]];
//# 次の3文字セットのループに移るため、iの値をリセット
i = 0;
}
}
//# while文を抜けて、もし「i」が0でない場合
//# ⇒これ以上3の倍数が作れずに1文字or2文字で余った場合に、この分岐に突入
if (i)
{
//# 端数で3文字に満たない部分はゼロ埋め
//# RainbowEngineの例では、[0]=e、[1]=0埋め、[2]=0埋めとなる
for(j = i; j < 3; j++){
char_array_3[j] = '\0';
cout << "======== j= " << j << " char_array_3[j]:" << char_array_3[j] << endl;
}
//# 3の倍数の時と同じ処理(8ビット×3組 →6ビット×4組へ変換 →8ビット×4組へ補完)を実施
char_array_4[0] = (char_array_3[0] & 0xfc) >> 2;
char_array_4[1] = ((char_array_3[0] & 0x03) << 4) + ((char_array_3[1] & 0xf0) >> 4);
char_array_4[2] = ((char_array_3[1] & 0x0f) << 2) + ((char_array_3[2] & 0xc0) >> 6);
char_array_4[3] = char_array_3[2] & 0x3f;
//# Base64の変換表に沿って、変換後の文字列を結果変数(ret)に格納
for (j = 0; (j < i + 1); j++){
ret += base64_chars[char_array_4[j]];
cout << "========== j=" << j << " ret:" << ret << endl;
}
//# 8ビットが全て「0」埋めされているchar_array_4は「'='」で埋める
while((i++ < 3))
ret += '=';
}
return ret;
}
//# デコードメソッド
//# 第一引数: Base64のエンコード結果の文字列
string base64_decode(string const& encoded_string) {
//# エンコード結果の文字列の長さを取得
int in_len = encoded_string.size();
//# ループ用の変数
int i = 0;
int j = 0;
int in_ = 0;
//# 「_4」はBase64変換後のエンコード済み文字セット(6bit×4=24bit)
//# 「_3」はBase64変換前のデコード済み文字セット(8bit×3=24bit)
unsigned char char_array_4[4], char_array_3[3];
//# 結果格納用の変数
string ret;
//# 入力文字列の文字数だけwhileで繰り返す(in_len--) かつ 文字が'='でない場合
while (in_len-- && ( encoded_string[in_] != '=') && is_base64(encoded_string[in_])) {
cout << "===LOOP:" << in_len << " i=" << i << " char_array_4[" << i << "] : " << encoded_string[in_] << endl;
//# Base64変換後の文字セット(8bit×4=32bit)に、入力の文字を1文字格納する
char_array_4[i++] = encoded_string[in_]; in_++;
//# 4の倍数でBase64のデコード変換を実施
if (i ==4) {
for (i = 0; i <4; i++)
char_array_4[i] = base64_chars.find(char_array_4[i]);
//# エンコード時の逆の処理を実施
//# char_array_4[0]= 00010100 ⇒1文字目のバイト[U] →2ビット左シフト
//# char_array_4[1] & 0x30 = 00100110 & 00110000(マスク) = 00[10]0000 ⇒2文字目のバイト[m] →4ビット右シフト
char_array_3[0] = (char_array_4[0] << 2) + ((char_array_4[1] & 0x30) >> 4);
//# 値の出力確認
bitset<8> char_array_4_0(char_array_4[0]);
bitset<8> char_array_4_1_1(char_array_4[1] & 0x30);
bitset<8> char_array_3_0(char_array_3[0]);
cout << "====== char_array_3[0]= " << char_array_3_0 << " char_array_4_0= " << char_array_4_0 << " char_array_4_1_1= " << char_array_4_1_1 << endl;
//# char_array_4[1] & 0xf = 00100110 & 00001111(マスク) = 0000[0110] ⇒2文字目のバイト[m] →4ビット左シフト
//# char_array_4[2] & 0x30 = 00000101 & 00111100(マスク) = 00[0001]00 ⇒3文字目のバイト[F] →2ビット右シフト
char_array_3[1] = ((char_array_4[1] & 0xf) << 4) + ((char_array_4[2] & 0x3c) >> 2);
//# 値の出力確認
bitset<8> char_array_4_1_2(char_array_4[1] & 0xf);
bitset<8> char_array_4_2_1(char_array_4[2] & 0x3c);
bitset<8> char_array_3_1(char_array_3[1]);
cout << "====== char_array_3[1]= " << char_array_3_1 << " char_array_4_1_2= " << char_array_4_1_2 << " char_array_4_2_1= " << char_array_4_2_1 << endl;
//# char_array_4[2] & 0x30 = 00000101 & 00000011(マスク) = 000000[01] ⇒3文字目のバイト[F] →6ビット左シフト
//# char_array_4[3]= 00101001 ⇒4文字目のバイト[p]
char_array_3[2] = ((char_array_4[2] & 0x3) << 6) + char_array_4[3];
//# 値の出力確認
bitset<8> char_array_4_2_2(char_array_4[2] & 0x3);
bitset<8> char_array_4_3(char_array_4[3]);
bitset<8> char_array_3_2(char_array_3[2]);
cout << "====== char_array_3[2]= " << char_array_3_2 << " char_array_4_2_2= " << char_array_4_2_2 << " char_array_4_3= " << char_array_4_3 << endl;
//# 変換後の文字列を結果変数(ret)に格納
for (i = 0; (i < 3); i++)
ret += char_array_3[i];
//# 次の3文字セットのループに移るため、iの値をリセット
i = 0;
}
}
//# もし「i」が0でない場合で「'='」にぶつかった場合
//# ⇒これ以上4の倍数が作れずに1文字or2文字or3文字で余った場合に、この分岐に突入
if (i) {
for (j = i; j <4; j++)
char_array_4[j] = 0;
for (j = 0; j <4; j++)
char_array_4[j] = base64_chars.find(char_array_4[j]);
//# エンコード時の逆の処理を実施
char_array_3[0] = (char_array_4[0] << 2) + ((char_array_4[1] & 0x30) >> 4);
char_array_3[1] = ((char_array_4[1] & 0xf) << 4) + ((char_array_4[2] & 0x3c) >> 2);
char_array_3[2] = ((char_array_4[2] & 0x3) << 6) + char_array_4[3];
for (j = 0; (j < i - 1); j++) ret += char_array_3[j];
}
return ret;
}
int main(void){
//# 文字列リテラルは「const char[X]」型になる。
//# 更に「unsigned」が付いているため、「unsigned const char[X]」になる
unsigned char input_str[] = "RainbowEngine";
//unsigned char* input_str_ptr = input_str;
int len_str;
//# 文字列の長さを計算
//# [文字列全体の長さ] / [文字列1文字目の長さ]
len_str = sizeof(input_str) / sizeof(input_str[0]);
//# 終端文字(ヌル文字)の除去
len_str -= 1;
cout <<"(1)入力文字列 : "<< input_str << endl;
//cout <<"(2)エンコード後文字列 : " << endl << base64_encode(input_str, len_str)<< endl;
//cout <<"(3)デコード後文字列 : "<< base64_decode(base64_encode(input_str, len_str))<< endl;
cout <<"(3)デコード後文字列 : "<< endl << base64_decode("UmFpbmJvd0VuZ2luZQ==")<< endl;
}
文字を1文字ずつ読み込み、U→m→F→pと4文字揃ったタイミングでデコード処理をしている様子がうかがえます。