Raspberry Picoで電子オルゴールな企画がいつの間にか本格自作MIDI音源になった話
今回は東方Jukebox企画の裏側ついてご紹介します。くろ。さんが以前に作成した電子オルゴールはこういうものでした。今回の東方JukeBoxはこれの改良版になります。
https://booth.pm/ja/items/5200088
今これを書いているyohineは今回のプロジェクトに全面的に協力支援しておりますが、10年以上東方界隈から遠ざかっておりました。オーディオ関係をきっかけに2024年の10月に例大祭にくろ。さんのサークル売り子の手伝いをして、その夜に現在の東方界隈についていろいろなお話を聞いて、東方USB-DACの次のハードウェア企画の原点である秘封電子オルゴールの改良版の構想についてお話を聞き興味を持ちました。
できることはたくさんあるので、せっかくなら良いものにしよう、ほかにはない特別なものにしよう、そう思いました。
しかしながら電子オルゴールというカテゴリを調べてみるとこちらのサークルさんがすでに魅力的な製品を作っていましたので、今更電子音で音楽がなるだけの電子オルゴールには多少楽曲数が増えても優位性はないと判断しました。

https://honeytoast.booth.pm/items/3381362
値段が上がっていくほどモノとしての価値が大事ですし、残念ながらこういう方向性のセンスはyohineもあまり持ち合わせていないので、これと同じカテゴリではまず勝ち目はありません。電子オルゴールという方向性は早期に捨てることになります。
モノとしての価値は既存の電子オルゴールに勝てない。別の強みが必要
ではどうするのか。後発になりますので競合を避けるため異なるカテゴリで唯一独自の強みがあるプロダクトでなければならないです。
勝負するなら自分たちの強みで勝負しなければなりません。yohineとくろ。さんの2人が組んだ想定での強みは下記のとおりです。
- ソフトウェアとハードウェアの総合設計力
- 本格的なオーディオ音質への価値観と評価軸
- 音楽制作と音源制作の両方の技術と知識
- コストダウンと理想主義の価値観の共有
やはり勝負すべきは外観ではなくて音楽の質や音の説得力や再生機器としての総合的な品質です。
もちろん楽曲制作単体であればもっと上の能力を持つ人はいくらでもいますが、音楽と音源の制作力に加えてハードウェアとソフトウェアの設計力を兼ねて「音の出るハードウェア」を作っている東方サークルはないはずなので十分勝負ができる、と予想しました。

そこでラジカセのイメージ(画像参考)を伝えて、現在のコンセプトの雛形が出来上がります。10月時点で決まっていたのは下記のような項目です。
- いかにも電子という音色(PWMや矩形)ではなくて、サンプリング音源で本格的な音色を搭載する
- 同時発音数が少なく良い音楽を作るにはオーディオ以外に音楽の技術が必要なのでそこはyohineが協力する
- 流用できそうなInnocent Keyの過去楽曲を移植する。新曲も簡単なものをいくつか作る(いつの間にか大ボリュームに)
- 原価は1000円台でスピーカ付き3000~5000円を頒布価格にする(いつの間にか15000円に)
- 秘封電子オルゴールと同じRP2040を使ってソフトも流用してオペアンプで小型スピーカを駆動(いつの間にか専用ソフト、専用アンプIC、3CPUに)
今考えるとこの時点ではだいぶ楽観視していたと思います。予想より遥かに大変で大規模なプロジェクトであることに、この時点ではふたりともまだ気づいていませんでした。
本格的な制作がスタートすると、目標ははるか遠くへ…
やるならできる範囲で最高のものをというコンセプトで東方JukeBox企画がスタートします。といっても実際にすべての作業がスタートしたのは2025年の1月からです。
ハードウェアの初期試作からまともに1曲再生できるまでに1ヶ月以上かかりました。何度も挫折しそうになりながらも最終的には現状のような音が出せるようになってました。
簡単に経緯をまとめると次のようになります。
- yohineがkontakt上で規定容量を満たす「厳選PCM音源」を作成し、予定された音源スペック(22kHz/mono/ 16bitで8MB上限)の音色パッチを制作開始
- くろ。さんはその間にUSB-MIDI通信部とPCM音源部をプログラミング。1月後半にはPCM音源の最低限の動作、MIDIからの動作も早期に動作できており、発音数は20音前後確保
- このスペックで行けると確信しyohineが発音数20前後でギリギリ再生できるサンプル音源(完成目標のようなもの)をDAW上でいくつか作成
- しかし同時発音上限付近であらゆるトラブルが続出し、対策の追加ごとに同時発音数が激減。MIDI受信部とデータ管理部の分離も必要になりCPUが1つ増える
- 22kサンプリングでは一部の音色に致命的な折り返しノイズが発生することが発覚し、44kにデータ領域を拡張して大幅に処理速度もROM容量も不足。結局CPUが更に1つ増える
- 途中でいつの間にか必須になったリバーブの実装も超難航(yohineもプログラムに協力して2週間ほど)
- オペアンプで鳴ると思っていた小型SPが予想外に重く専用アンプIC必須に
大まかですがこのようにどんどんプロジェクトが大変になっていきました。原価もいつの間にか1000円台では到底無理な規模へ…。
すべての原因は最初に作った仮音源の予定クオリティがCPU1つでは到底無理な内容だったこと。そしていつの間にかそれが重要な到達目標になっていたことでしょうか。
すべての原因となった仮データ(当時KontaktとDAWで作ったもの)はこんな感じでしたが、これができそうでできない絶妙な難易度の高いデータだったことが大問題でした。
そして苦労の末に最終的に東方JukeBoxで音を出して録音したものがこちらです。
頑張った甲斐があってリバーブも音色も少し荒いものの表現はしっかり出せていると思います!やっとここまで来ました。
東方JukeBoxはくろ。さんの悲鳴でできています
上記では細かすぎて省略してますが、ここに書いていないような細かい問題も続出しまくっていて本当に大変なプロジェクトでした。当初1ヶ月の予定が2ヶ月かかっても終わってなかったですからね…。
yohineも同様に、音源レベルが電子オルゴールどころではない、本格的な自作MIDI音源レベルにまで高まったため、搭載楽曲の準備に必要な仕事量が予想以上に増殖(移植込でも2ヶ月で完パケ30曲overなので…)、15年ぶりくらいに音楽制作関係で本気で必死になりました。
が、それより人生でほぼ初なくらいに高いハードルだったこともあって、くろ。さんはもっと大変だったと思います。途中何度くろ。さんの絶望的な声を聞いたことか…無茶な目標にめげず最後まで頑張ってくれてありがとうございました。
たとえば、途中で同時発音数8音に落として音色数も大幅に減らして、ちょっと良い電子オルゴール規模に実装レベルを落としていたら、きっと2人とも楽はできていたと思いますが、全然諦めることはありませんでしたね。
もしそれだと今回のクオリティは全く実現できていなかったと思います。
しかし苦労に見合う世間の評価は伴わないという予想

マイコンの自作系電子オルゴールとしても、自作オリジナルMidi音源としても、今回の東方JukeBoxの出音はRP2040から音が出ていると考えたらおそらく破格のクオリティ(自画自賛ですけど)だと思っています。
ただ表題のとおり、世間の評価は苦労ほどには伴わないと予想しています。
世の中には自作基板にマイコンで単純波形を小さいスピーカに繋いで誰もが知ってる有名曲を流す動画が割とバズってたりしますが、東方JukeBoxはそういうことはないと思います。多分サンプル曲を聞いたらRP2040だけで鳴らしているとは思われないでしょうし、無意識的に違うカテゴリと比較されるでしょう。
最大の問題はスマートスピーカとかスマートフォンの存在です。これらがあまりにも低コストで優秀すぎます。サブスクで好きなだけ好きな曲を聞ける現在において、このようなプロダクトにどんな存在価値があるのかは作っておきながら疑問です。
結局のところ東方というコンテンツとキャラクター性が前提でありその範疇でしかないと思います。
一昔前ならともかく、真面目に考えるとスマートスピーカに対して優位性は皆無で、単純な再生機能だけで見ると勝負になりません。残念ながら「スピーカが付いていて、USB電源だけでいつでもどこでも聞けます」という特徴も含めてです。
特に普通の人にとっては知らない東方楽曲が30曲ちょっと入っているだけのハードウェアなんて価格に見合う価値はないと思います。巷にあふれる好きな既存曲を好きに聞けないし、オンラインにも繋がらないしできることも音のクオリティもスマートスピーカ以下なのは間違いありません。ボーカル曲もできないですし。
それがわかっていたので、開発しながらこのプロダクトをどういう層に対してどうアピールするのか、ずっと考えていました。
一応、スマートスピーカではできない、東方JukeBoxの独自性は次の点にあります。
- シームレスな無限ループ再生ができる
- 再生データと音源が分離されているので、個別パートのソロ再生やミュート、バランス、音程、テンポの変更に対応ができる
- ピアノロール表示もあるし、MIDIデータの中身を公開することもできる、古い時代のDTM技術に興味がある人のみ
- USB-MIDIとして内部の音源にアクセスができる(ただし音源に制約あり)
- USB-MIDI利用者同士の小さいコミュニティがあれば音源共有で楽しみが広げられる可能性(コミュニティは準備中)
しかし、いずれもわかりやすいアピールはできませんし、今どきの普通の人には届きそうもありません。
これがハードウェアのゲーム筐体であれば、音ゲーにしたり、他のジャンルでもインタラクティブな音源演出や無限ループができて、これらの実装の存在意義があるのですが、単純な再生プレイヤーではこれらに意義があるとは思いません。
結局、普通の人に東方JukeBoxの価値を理解してもらうことはほぼ不可能だと思っています。
この価値が理解できるのは、少なくとも電子工作などの自作をやっていたり、昔のDTM音源やゲーム音源の歴史を知っている、ごく一部の層だと思います。生粋の消費者ではなく何らかの生産者や開発者だけでしょう。だからこそ、生産数は数十台まで絞って、分かる人にだけわかれば良い、ごく限られた層にだけ届けるもので良い、そう結論付けました。
結果として15000円という価格もそれを後押ししています。ここで書いている文章もそういった特定の人に届けばよいと思って書いています。
なので売り物としては大成功はないと思っていますが、長い目でみれば東方JukeBoxは今後のFlanSEEの技術デモとして、何らかの役には立つはずと思っています。