Quantcast
Channel: プログラミング
Viewing all articles
Browse latest Browse all 7857

RaspberryPi5で挑む!DockerとOllamaを活用したローカルLLM環境の構築と実験 - uepon日々の備忘録

$
0
0
<p>以前の投稿では、少し古いゲーミングPCに<code>Ubuntu</code>をインストールし、<code>Dockerコンテナ</code>を使って<code>Ollama</code>を起動し、<code>ローカルLLM環境</code>を構築しました。</p>

<p>PC上<code>でローカルLLM</code>を動作させていましたが、最近ではモデルサイズが小さく、よりコンパクトな<code>LLM</code>が登場しています。このようなモデルであれば、<code>RaspberryPi</code>のようなエッジデ<a class="keyword" href="https://d.hatena.ne.jp/keyword/%A5%D0%A5%A4%A5%B9">バイス</a>でも動作可能です。少し前には、<code>RaspberryPi5</code>で<code>TinyLlama</code>というコンパクトな<code>LLM</code>を動作させる記事が話題になっていました。</p>

<p><strong>参考</strong></p>

<p><iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fqiita.com%2Fkazuhitoyokoi%2Fitems%2F66e8c9e1b447a2850ba7" title="Raspberry Pi 5上で軽量LLM、TinyLlamaを動かしてみる - Qiita" class="embed-card embed-webcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 155px; max-width: 500px; margin: 10px 0px;" loading="lazy"></iframe><cite class="hatena-citation"><a href="https://qiita.com/kazuhitoyokoi/items/66e8c9e1b447a2850ba7">qiita.com</a></cite></p>

<p><iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fzenn.dev%2Fkaraage0703%2Farticles%2F5fd411a9358898" title="Raspberry Pi（ラズパイ）のローカル環境でLLMを動かす" class="embed-card embed-webcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 155px; max-width: 500px; margin: 10px 0px;" loading="lazy"></iframe><cite class="hatena-citation"><a href="https://zenn.dev/karaage0703/articles/5fd411a9358898">zenn.dev</a></cite></p>

<p><iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fkotamorishita.com%2Fraspberrypi-ollama-llm%2F" title="ラズベリーパイでローカルLLM" class="embed-card embed-webcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 155px; max-width: 500px; margin: 10px 0px;" loading="lazy"></iframe><cite class="hatena-citation"><a href="https://kotamorishita.com/raspberrypi-ollama-llm/">kotamorishita.com</a></cite></p>

<p>恥ずかしながら今回の内容は<strong>その<a class="keyword" href="https://d.hatena.ne.jp/keyword/%B2%BF%C8%D6%C0%F9%A4%B8">何番煎じ</a></strong>というものです🫠🫠🫠
作業内容は参考サイトでもかなり記載があるので、こちらではある程度にとどめ、私は使用感など見ていきたいと思います。</p>

<ul class="table-of-contents">
    <li><a href="#今回の動作環境">今回の動作環境</a></li>
    <li><a href="#RaspberryPiにDockerをインストール">RaspberryPiにDockerをインストール</a></li>
    <li><a href="#OllamaのDockerコンテナを作成する">OllamaのDockerコンテナを作成する</a></li>
    <li><a href="#RaspberryPiでローカルLLMを動作させる">RaspberryPiでローカルLLMを動作させる</a></li>
    <li><a href="#今回使用したLLMとその起動コマンド">今回使用したLLMとその起動コマンド</a><ul>
            <li><a href="#起動コマンド一覧">起動コマンド一覧</a></li>
            <li><a href="#tinyllama11bの使用">tinyllama:1.1bの使用</a></li>
            <li><a href="#gemma22bの使用">gemma2:2bの使用</a></li>
            <li><a href="#phi338bの使用">phi3:3.8bの使用</a></li>
        </ul>
    </li>
    <li><a href="#モデルサイズの限界への挑戦">モデルサイズの限界への挑戦</a><ul>
            <li><a href="#llama318bの使用">llama3.1:8bの使用</a></li>
        </ul>
    </li>
    <li><a href="#おわりに">おわりに</a></li>
</ul>

<h1 id="今回の動作環境">今回の動作環境</h1>

<p>今回の動作環境はRaspberry5（8GB）に最新（2024.08.14時点）のRaspberryPiOS（bookworm）で確認しています。</p>

<p><span itemscope itemtype="http://schema.org/Photograph"><img src="https://cdn-ak.f.st-hatena.com/images/fotolife/u/ueponx/20240816/20240816232844.png" width="926" height="427" loading="lazy" title="" class="hatena-fotolife" itemprop="image"></span></p>

<h1 id="RaspberryPiにDockerをインストール">RaspberryPiにDockerをインストール</h1>

<p>PC同様に<code>RaspberryPi</code>にも<code>Docker</code>をインストールを行います。<code>RaspberryPi</code>への<code>Docker</code>のインストールに関しては過去にも取り上げました。<code>Docker</code>のサイトにも作業方法が載っています。</p>

<p><strong>参考</strong></p>

<p><iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fuepon.hatenadiary.com%2Fentry%2F2022%2F05%2F26%2F012508" title="RaspberryPiでもDockerしたい！ - uepon日々の備忘録" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;" loading="lazy"></iframe><cite class="hatena-citation"><a href="https://uepon.hatenadiary.com/entry/2022/05/26/012508">uepon.hatenadiary.com</a></cite></p>

<p><iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fdocs.docker.com%2Fengine%2Finstall%2Fdebian%2F" title="Install Docker Engine on Debian" class="embed-card embed-webcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 155px; max-width: 500px; margin: 10px 0px;" loading="lazy"></iframe><cite class="hatena-citation"><a href="https://docs.docker.com/engine/install/debian/">docs.docker.com</a></cite></p>

<p>念の為に<code>Gist</code>でコマンドの流れをまとめておきます。</p>

<p><script src="https://gist.github.com/ueponx/ee097ff3b5f0a388d060ad4ce7b62c7b.js"> </script></p>

<p><a href="https://gist.github.com/ueponx/ee097ff3b5f0a388d060ad4ce7b62c7b">RaspberryPiにDockerをインストール</a></p>

<h1 id="OllamaのDockerコンテナを作成する">OllamaのDockerコンテナを作成する</h1>

<p>こちらの作業は以前のエントリを参考にします。このあたりは<code>Docker</code>という共通基盤があるので大きくは変わりません。
先日のエントリと大きく異なるのは<code>GPU</code>がないという点です。そのあたりを気をつけて以下のコマンドを実行してコンテナを構築します。</p>

<p><iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fuepon.hatenadiary.com%2Fentry%2F2024%2F08%2F02%2F120526" title="ローカルLLMをWebUIで手軽に操作！噂のllama3、phi3、Graniteも使える！ - uepon日々の備忘録" class="embed-card embed-blogcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 190px; max-width: 500px; margin: 10px 0px;" loading="lazy"></iframe><cite class="hatena-citation"><a href="https://uepon.hatenadiary.com/entry/2024/08/02/120526">uepon.hatenadiary.com</a></cite></p>

<p><strong>コンテナの構築（初回）</strong></p>

<pre class="code lang-sh" data-lang="sh" data-unlink>$ <span class="synStatement">mkdir</span> ~/ollama <span class="synComment"># ホストとのファイル共有ディレクトリ作成</span>
$ docker run <span class="synSpecial">-d</span>  <span class="synSpecial">-v</span> ~/ollama:/ollama <span class="synSpecial">-p</span> 11434:11434 <span class="synSpecial">--name</span> ollama ollama/ollama
</pre>


<p><span itemscope itemtype="http://schema.org/Photograph"><img src="https://cdn-ak.f.st-hatena.com/images/fotolife/u/ueponx/20240816/20240816233357.png" width="956" height="289" loading="lazy" title="" class="hatena-fotolife" itemprop="image"></span></p>

<p><strong>コンテナの起動（2回目以降）</strong></p>

<pre class="code lang-sh" data-lang="sh" data-unlink>$ docker <span class="synStatement">start</span> ollama
</pre>


<p><code>Docker</code>を使用することでほとんどの作業はOSに依存することなく作成できますね。
これで準備完了です。</p>

<h1 id="RaspberryPiでローカルLLMを動作させる">RaspberryPiでローカルLLMを動作させる</h1>

<p>あとは、<code>Dockerコンテナ</code>の<code>Ollama</code>を使用して<code>LLM</code>を起動していきます。今回はサンプル数の少ない<strong>1B～3B程度</strong>のモデルを使います。また、別の視点でモデルの限界の大きさにもトライする意味を込めて<code>llama3.1:8B</code>も起動してみます。</p>

<p><strong>Ollamaをモデル指定して起動する一般的な形</strong></p>

<pre class="code lang-sh" data-lang="sh" data-unlink>$ docker <span class="synStatement">exec</span> <span class="synSpecial">-it</span> ollama ollama run 【モデル名】
</pre>


<p><strong>Ollamaに対応したモデルの一覧はこちらになります</strong></p>

<p><iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Follama.com%2Flibrary" title="library" class="embed-card embed-webcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 155px; max-width: 500px; margin: 10px 0px;" loading="lazy"></iframe><cite class="hatena-citation"><a href="https://ollama.com/library">ollama.com</a></cite></p>

<h1 id="今回使用したLLMとその起動コマンド">今回使用したLLMとその起動コマンド</h1>

<p>今回使用したのは以下のモデルになります。</p>

<ul>
<li>tinyllama:1.1b</li>
<li>gemma2:2b</li>
<li>phi3:3.8b</li>
<li>llama3.1:8b（大きなモデルの実験）</li>
</ul>


<p>今回の実行では、CPUやメモリの消費量を確認したいこともあったので、実行するTerminalの隣に<code>htopコマンド</code>（topコマンドより見やすい）の結果を並列に表示しています。どのモデルを実行してもCPUの4コアあるコアのすべてが100%の使用になり、<code>RaspberryPi</code>につけたファンも全開で回っています。電源は<strong>5V5A出力</strong>のACアダプタ、<strong>ファン必須</strong>と考えたほうが良さそうです。自分はこのためにACアダプタを以下のものに新調しました。</p>

<p><strong>参考</strong></p>

<p><div class="hatena-asin-detail"><a href="https://www.amazon.co.jp/dp/B0CXXXDB71?tag=ueponx0a-22&amp;linkCode=ogi&amp;th=1&amp;psc=1" class="hatena-asin-detail-image-link" target="_blank" rel="noopener"><img src="https://m.media-amazon.com/images/I/31f+Rj7HfEL._SL500_.jpg" class="hatena-asin-detail-image" alt="Smraza Raspberry Pi 5用 USB-C (Type C）電源、5.1V 5A PD 27W ラズベリーパイ5用ACアダプター Raspberry Pi 5に適用（ブラック）" title="Smraza Raspberry Pi 5用 USB-C (Type C）電源、5.1V 5A PD 27W ラズベリーパイ5用ACアダプター Raspberry Pi 5に適用（ブラック）"></a><div class="hatena-asin-detail-info"><p class="hatena-asin-detail-title"><a href="https://www.amazon.co.jp/dp/B0CXXXDB71?tag=ueponx0a-22&amp;linkCode=ogi&amp;th=1&amp;psc=1" target="_blank" rel="noopener">Smraza Raspberry Pi 5用 USB-C (Type C）電源、5.1V 5A PD 27W ラズベリーパイ5用ACアダプター Raspberry Pi 5に適用（ブラック）</a></p><ul class="hatena-asin-detail-meta"><li>Smraza</li></ul><a href="https://www.amazon.co.jp/dp/B0CXXXDB71?tag=ueponx0a-22&amp;linkCode=ogi&amp;th=1&amp;psc=1" class="asin-detail-buy" target="_blank" rel="noopener">Amazon</a></div></div></p>

<p><iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Fja.wikipedia.org%2Fwiki%2FHtop" title="htop - Wikipedia" class="embed-card embed-webcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 155px; max-width: 500px; margin: 10px 0px;" loading="lazy"></iframe><cite class="hatena-citation"><a href="https://ja.wikipedia.org/wiki/Htop">ja.wikipedia.org</a></cite></p>

<h2 id="起動コマンド一覧">起動コマンド一覧</h2>

<pre class="code lang-sh" data-lang="sh" data-unlink><span class="synComment"># tinyllama:1.1b</span>
$ docker <span class="synStatement">exec</span> <span class="synSpecial">-it</span> ollama  ollama run tinyllama:1.1b

<span class="synComment">#  gemma2:2b</span>
$ docker <span class="synStatement">exec</span> <span class="synSpecial">-it</span> ollama ollama run gemma2:2b

<span class="synComment"># phi3:3.8b</span>
$ docker <span class="synStatement">exec</span> <span class="synSpecial">-it</span> ollama ollama run phi3:3.8b

<span class="synComment"># llama3.1:8b</span>
$ docker <span class="synStatement">exec</span> <span class="synSpecial">-it</span> ollama  ollama run llama3.1:8b
</pre>


<h2 id="tinyllama11bの使用">tinyllama:1.1bの使用</h2>

<p>後述する<code>llamaモデル</code>をリファインした<a class="keyword" href="https://d.hatena.ne.jp/keyword/%A5%AA%A1%BC%A5%D7%A5%F3%A5%BD%A1%BC%A5%B9">オープンソース</a>モデルになります。</p>

<blockquote><p>The TinyLlama project is an open <a class="keyword" href="https://d.hatena.ne.jp/keyword/endeavor">endeavor</a> to train a compact 1.1B Llama model on 3 trillion tokens.</p></blockquote>

<p>他のモデルではプロンプトの日本語化にも対応しているのですが、こちらのモデルでは英語がベースなのでプロンプトも英語に訳してから使用しています。結果としては運が良ければ、唐揚げの作り方知っているような返答は来ますが、運が悪いと全く異なるものとして認識した返答もしばしばあります。プロンプトの工夫を行う必要はあるのかもしれません。</p>

<p><strong>参照</strong></p>

<p><iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Follama.com%2Flibrary%2Ftinyllama" title="tinyllama" class="embed-card embed-webcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 155px; max-width: 500px; margin: 10px 0px;" loading="lazy"></iframe><cite class="hatena-citation"><a href="https://ollama.com/library/tinyllama">ollama.com</a></cite></p>

<p><strong>実行例</strong></p>

<p><iframe width="560" height="315" src="https://www.youtube.com/embed/hBb_-vBkGJw?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen title="RaspberryPi5-Dcoker-Ollama-Tinyllamaで英語プロンプトで「からあげの作り方」"></iframe><cite class="hatena-citation"><a href="https://www.youtube.com/watch?v=hBb_-vBkGJw">www.youtube.com</a></cite></p>

<p><strong>出力例</strong></p>

<pre class="code txt" data-lang="txt" data-unlink>&gt;&gt;&gt; How to make fried chicken?
Here&#39;s how to make fried chicken using an electric frying pan:

Ingredients:
- 2 lbs boneless, skinless chicken breast (cut into pieces)
- Salt and pepper
- 1/4 cup cornstarch
- 2 tbsp vegetable oil
- 2 tbsp flour

Instructions:
1. Heat the oil in a large electric frying pan over medium heat.
2. Season the chicken with salt and pepper on both sides.
3. Dredge each piece in cornstarch until lightly coated.
4. Carefully place the chicken into the pan, skin side down.
5. Cook for 2-3 minutes or until golden brown on one side.
6. Using a slotted spoon, transfer the fried chicken to a paper 
towel-lined plate or clean dish towel.
7. Repeat with the remaining chicken pieces.
8. Drain excess oil and serve hot. Enjoy your homemade fried chicken!</pre>


<p><span itemscope itemtype="http://schema.org/Photograph"><img src="https://cdn-ak.f.st-hatena.com/images/fotolife/u/ueponx/20240818/20240818231128.png" width="928" height="539" loading="lazy" title="" class="hatena-fotolife" itemprop="image"></span></p>

<h2 id="gemma22bの使用">gemma2:2bの使用</h2>

<p><code>Google</code>が開発するAI<a class="keyword" href="https://d.hatena.ne.jp/keyword/%A5%AA%A1%BC%A5%D7%A5%F3%A5%BD%A1%BC%A5%B9">オープンソース</a>モデル<code>Gemma2</code>となります。今回はもっとも小さい<code>2Bモデル</code>を使用しています。<code>2Bのモデル</code>ですが日本語の対応も素晴らしい結果です。</p>

<blockquote><p><a class="keyword" href="https://d.hatena.ne.jp/keyword/Google">Google</a> Gemma 2 is a high-performing and efficient model by now available in three sizes: 2B, 9B, and 27B.</p></blockquote>

<p><strong>参照</strong></p>

<p><iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Follama.com%2Flibrary%2Fgemma2%3A2b%2Fblobs%2F7462734796d6" title="gemma2:2b/model" class="embed-card embed-webcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 155px; max-width: 500px; margin: 10px 0px;" loading="lazy"></iframe><cite class="hatena-citation"><a href="https://ollama.com/library/gemma2:2b/blobs/7462734796d6">ollama.com</a></cite></p>

<p><strong>実行例</strong></p>

<p><iframe width="560" height="315" src="https://www.youtube.com/embed/sfZYcTOgny0?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen title="RaspberryPi5-Dcoker-Ollama-Gemma2で日本語プロンプトで「からあげの作り方」"></iframe><cite class="hatena-citation"><a href="https://www.youtube.com/watch?v=sfZYcTOgny0">www.youtube.com</a></cite></p>

<p>日本語の対応していて、かつかなり早い返答をしてくれるという意味では今回の中では一番優秀な結果だったと思います。
また、かなり情報精度もとてもいい感じです。</p>

<p><strong>出力例</strong></p>

<pre class="code txt" data-lang="txt" data-unlink>&gt;&gt;&gt; からあげの作り方
## からあげの作り方 

**材料（4人分）**
* Chicken (鶏肉) : 500g (約1.1lb)
* 片栗粉 : 150g 
* 塩 : 少々
* 胡椒 : 少々
* 醤油 : 大さじ2
* 酒 : 大さじ1
* みりん : 大さじ1
* 生姜 : 少々 (お好みで)
* サラダ油 : 大さじ1

**作り方**
1. **鶏肉の準備:** 
    * 鶏肉の皮と骨を取り除く。
    * 厚さ3cm程度に切り、一口大にする。
2. **片栗粉のつけ方:** 
    * フライパンを熱してサラダ油をひく。
    * 片栗粉をすべて加えて混ぜる。
3. **から揚げの調理:** 
    * 鶏肉に片栗粉をつけ、塩、胡椒をまぶす。
4. **味付け:** 
    * 醤油、酒、みりん、生姜（お好みで）を加え、よく混ぜ合わせる。
5. **揚げる:** 
    * 熱した油 (170℃程度) で、から揚げを両面を揚げる。（中火～弱火でゆっ
くりと揚げる）
    * 油が飛んでくるまで揚げる。
6. **完成:** 
    * 揚げ上がったら、紙タオルなどで油を拭き取ります。
    * からあげを盛り付け、お好みでポン酢やソースをかけて食べましょう。

**ポイント**
* 鶏肉は、皮と骨を取り除くのがポイントです。
* 片栗粉のつけ方によって、から揚げがサクサクに仕上がります。
* 醤油、酒、みりんなどを混ぜることで、味が染み込みます。

 **その他**
* から揚げに使う鶏肉は、皮と骨を取り除くのがポイントです。
* 片栗粉のつけ方によって、から揚げがサクサクに仕上がります。
* 醤油、酒、みりんなどを混ぜることで、味が染み込みます。</pre>


<h2 id="phi338bの使用">phi3:3.8bの使用</h2>

<p><code>Phi3</code>は<a class="keyword" href="https://d.hatena.ne.jp/keyword/Microsoft">Microsoft</a>で開発している小型の<code>LLM</code>（小型の場合には<code>SLM</code>というらしい）となります。こちらも携帯電話やSBCなどでの活用を視野に開発されたモデルとのこと。<code>Phi3</code>の<a class="keyword" href="https://d.hatena.ne.jp/keyword/%C2%E8%B0%EC%B8%C0%B8%EC">第一言語</a>は英語なので、日本語の場合、能力が低下すると書かれていた割にはかなり高性能と感じています。</p>

<blockquote><p>Phi-3 is a family of lightweight 3B (Mini) and 14B (Medium) state-of-the-art open models by <a class="keyword" href="https://d.hatena.ne.jp/keyword/Microsoft">Microsoft</a>.</p></blockquote>

<p><strong>参照</strong></p>

<p><iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Follama.com%2Flibrary%2Fphi3" title="phi3" class="embed-card embed-webcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 155px; max-width: 500px; margin: 10px 0px;" loading="lazy"></iframe><cite class="hatena-citation"><a href="https://ollama.com/library/phi3">ollama.com</a></cite></p>

<p><strong>実行例</strong></p>

<p><iframe width="560" height="315" src="https://www.youtube.com/embed/xD1IwCLw6gg?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen title="RaspberryPi5-Dcoker-Ollama-phi3で日本語プロンプトで「からあげの作り方」"></iframe><cite class="hatena-citation"><a href="https://www.youtube.com/watch?v=xD1IwCLw6gg">www.youtube.com</a></cite></p>

<p>日本語にも対応しているモデルではありますが、よくわからない内容や表現もあるみたいです。</p>

<h1 id="モデルサイズの限界への挑戦">モデルサイズの限界への挑戦</h1>

<h2 id="llama318bの使用">llama3.1:8bの使用</h2>

<p><code>Meta</code>社の作成した<code>LLM</code>となります。大規模なモデルもありますが、今回は<code>8Bモデル</code>を使用しています。<code>RaspberryPi5</code>のメモリが<strong>8GB</strong>ということもあり、このサイズのものが限界に近いかなと感じています。ちなみにメモリが足りないと<code>Ollama</code>の起動に失敗します。</p>

<blockquote><p>Llama 3.1 is a new state-of-the-art model from Meta available in 8B, 70B and 405B parameter sizes.</p></blockquote>

<p><strong>参照</strong></p>

<p><iframe src="https://hatenablog-parts.com/embed?url=https%3A%2F%2Follama.com%2Flibrary%2Fllama3.1" title="llama3.1" class="embed-card embed-webcard" scrolling="no" frameborder="0" style="display: block; width: 100%; height: 155px; max-width: 500px; margin: 10px 0px;" loading="lazy"></iframe><cite class="hatena-citation"><a href="https://ollama.com/library/llama3.1">ollama.com</a></cite></p>

<p><strong>実行例</strong></p>

<p><iframe width="560" height="315" src="https://www.youtube.com/embed/NvQH4HfmF5k?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen title="RaspberryPi5-Dcoker-Ollama-Llame3.1で日本語プロンプトで「からあげの作り方」"></iframe><cite class="hatena-citation"><a href="https://www.youtube.com/watch?v=NvQH4HfmF5k">www.youtube.com</a></cite></p>

<p>今回は<code>8Bモデル</code>を動作させていて、メモリの使用量としては<code>htopコマンド</code>の結果では6GB程度使用しているので、<code>RaspberryPi5（8GB）</code>では、これより大きなモデルの使用は難しいでしょう。文書の生成スピードに関しては結構遅いかなと感じるのですが、かなり読み応えのある文を生成していることにも起因しているのかもしれません。また、日本語に対応しているモデルなのですが、意味不明であったり、わかりにくい表現も含まれているようです。このあたりは今後の期待でしょうか。</p>

<h1 id="おわりに">おわりに</h1>

<p>今回の実験では、<code>RaspberryPi5</code>という限られたリソースしかないエッジデ<a class="keyword" href="https://d.hatena.ne.jp/keyword/%A5%D0%A5%A4%A5%B9">バイス</a>上で、<code>Docker</code>を経由して<code>Ollama</code>の<code>LLM</code>を動作させてみました。<code>LLM</code>のモデルサイズや性能によっては、<code>RaspberryPi</code>のような小型デ<a class="keyword" href="https://d.hatena.ne.jp/keyword/%A5%D0%A5%A4%A5%B9">バイス</a>でもある程度動作可能であることが感じられたかなと思います。今後は更に小型や効率的なモデルが登場することで、エッジデ<a class="keyword" href="https://d.hatena.ne.jp/keyword/%A5%D0%A5%A4%A5%B9">バイス</a>での<code>LLM</code>利用も可能なのではないかと夢が広がります。この内容がエッジAIの活用におけるヒントとなればと思っています。</p>


Viewing all articles
Browse latest Browse all 7857

Trending Articles