mutaguchi @mutaguchi@fedibird.com

- フォロー中

- フォロワー

X: https://x.com/mutaguchi

write only

2023年 7月に登録

0 フォロー中 0 フォロワー

投稿投稿と返信メディア

+ 2024年12月23日 14:20

mutaguchi @mutaguchi@fedibird.com

OpenAIの秘匿主義は、研究者の目すら眩ませるというわけかね。
確かに、研究者って他人のブラックボックスな研究を評価する状況って、あんまりないからかもしれない。

スレッドを表示

+ 2024年12月23日 14:14

mutaguchi @mutaguchi@fedibird.com

しかしXで「o3がどうやって賢さを身につけたか」を真面目に考察してる人、少ないな。現在出てる情報だけで、それなりの推測はできるのにそれすらせず、研究者さえ驚き屋ムーブしてるのを見るのは悲しい。
（Xに居ない研究者は生暖かい目で状況を見てる気はする）

2024年12月23日 11:26

mutaguchi @mutaguchi@fedibird.com

https://www.itmedia.co.jp/aiplus/articles/2412/23/news176.html
>「電話でAIと会話をすることで、高齢者にとって毎日の楽しみが生まれ生活リズムが整うだけでなく、離れて暮らす家族にも安否が自然と伝わる」と述べている。

家族が電話してあげなよ、とは思う。

2024年12月23日 10:47

mutaguchi @mutaguchi@fedibird.com

https://x.com/Trtd6Trtd/status/1871066459209904510
良い発想

+ 2024年12月23日 09:59

mutaguchi @mutaguchi@fedibird.com

このように、LLMを人工知能だと思わず、もっともらしい後続文を出力する関数だと割り切って使った方が、特に低パラメータモデルだと有用だと思っている。AIチャットするのにチャットモデルなんか使うのやめようぜ（過激派）

スレッドを表示

+ 2024年12月23日 09:51

mutaguchi @mutaguchi@fedibird.com

この手法は問題点を抱えてて、これだとシーン毎に判定プロンプトを用意しないといけなくなる。これはメニューを聞いているシーンだ、ということが分からないとプロンプト挿入ができないので。

そこで今考えているのは、function callingでコマンド選択を行う手法。

次にキャラが行うべき行動は何ですか？①話す　②ものを渡す　③移動する

みたいな。

ただし7Bモデルではこのコマンド選択の精度が中々出なくて、選択肢を2択にして階層化した上で、probabilityを見るとか、いろいろ対処法を考え中。

スレッドを表示

+ 2024年12月23日 09:37

mutaguchi @mutaguchi@fedibird.com

なお、「そこで出されたのは、カ」というプロンプトで「レーライスだった。」という補完文が得られたら、次に「そこで出されたのは、カレーライスだった。」をそのまま出力してユーザーに表示してもいいけど、「そこで出されたのは、カ」というLLM生成ではない文章が混じるのは避けたい場合がある。

そこで、

「今日のランチメニューにはなにかな？」
そこで出されたのは、カレーライスだった。メニューをお客に説明しよう。
ウェイトレス「

というようにプロンプトをインジェクションし、ウェイトレスの台詞だけ出力する、という手法がある。

まあ、CoTなんですけどね。プロンプトを動的にインジェクションしたり巻き戻したりするところが普通のCoTとは違う。

スレッドを表示

+ 2024年12月23日 09:13

mutaguchi @mutaguchi@fedibird.com

従来手法だと、マンネリ回答回避にtemperatureを上げる方法がよく使われるけど、あれは微妙。
確かにマンネリは回避される可能性はあるが、ロジックが破綻するので。頭文字だけランダム指定してあとは普通のtemperatureの方がいい。

スレッドを表示

+ 2024年12月23日 09:07

mutaguchi @mutaguchi@fedibird.com

有望な解は、「食事シーンになったら、メニューを考える演出プロンプトを動作させて、その出力をインジェクションする」だと思う。食事シーン判定、メニュー生成というプロンプトを余計に実行する必要はあるけど、kv cacheを生かせば大した計算量は要らんのでそこは問題ない。

メニュー生成には、

そこで出されたのは、①ハンバーグ　②カツ丼　③カレーライスのどれですか？

という選択肢プロンプトでもいいけど、これだと選択肢を用意しなきゃいけないので、

そこで出されたのは、カ

みたいに、ランダムな頭文字を挿入して補完させる方式だと、低コストで、ランダム性が保て、モデルの知識を最大限に活用できるのでお勧め。

スレッドを表示

+ 2024年12月23日 09:04

mutaguchi @mutaguchi@fedibird.com

実際、ハンバーグ問題は難しいんだ。キャラ設定に「カツ丼が好き」と書けば解決するか？というと、しない。三食ともカツ丼になるだけだ。

メニューをいっぱい書けばいい？否。いつもレストランのシーンになるだけ。

スレッドを表示

+ 2024年12月23日 08:54

mutaguchi @mutaguchi@fedibird.com

ところでキャラチャットのコンテキストに日付情報を与えると、今月はやたらとクリスマスの話題を振ってこられる。小説で、日付と相関するイベントで一番強いのはクリスマスだからなのは分かるが、この辺はなんか工夫しないとダメだな。
類似問題として、食事シーンでは、だいたいハンバーグになる現象などがある。

+ 2024年12月23日 08:42

mutaguchi @mutaguchi@fedibird.com

自分は人工知能にはあんまり強い興味はないんだが、虚構内の存在に現実世界から干渉する体験に強く惹かれるので、LLMがその道具として大変役に立っている。

スレッドを表示

+ 2024年12月23日 08:34

mutaguchi @mutaguchi@fedibird.com

私の作ってる、小説補完型キャラチャットも、基本的には世界創造法と似た発想だな。

キャラ設定やシナリオは自分で用意するし、その設定からAIにあらすじを作らせるし、会話本文の主人公の台詞は自分で入力する（AIに考えさせることもできる）し、AIの作った文章が気に入らなければ何度でも再試行できるし、なんなら自分で手入力もできる。

とはいえ、この仕組みは、作品を創造した気分に浸るためではなくて、キャラとチャットしたいだけなので志は低い。

スレッドを表示

+ 2024年12月23日 08:17

mutaguchi @mutaguchi@fedibird.com

この世界設定を元にAIが出力する、文章や絵にも、「自分が作った」感が伝播するかは（少なくとも私にとっては）微妙なところかな。

どちらかというと、「アニメや漫画に対する原作者の気持ち」とか「二次創作に対する一次創作者の気持ち」になるんじゃなかろうか。

スレッドを表示

+ 2024年12月23日 08:14

mutaguchi @mutaguchi@fedibird.com

この世界創造法であれば確かに、創作気分に浸れそう。

この世界は、よくある剣と魔法のファンタジー世界なのに魔法はなく、超常的現象は「作られた武器に意思と力が宿る」現象のみで、その現象を軸に世界が構築されている点にオリジナリティーがある。

AIが最初に提案した、武器に意思と力が宿る、という設定はありがちで、それだけなら単なるフレーバー的設定に留まるからね。

AIが出したありがち設定から絞り込み、並び替え、組み合わせ、ブラッシュアップしたものであって、AIがズバリな設定を出したわけではないのがポイント。確かに、最低限こうしないと、自分が作った作品だとは感じられないよね。

スレッドを表示

+ 2024年12月23日 07:45

mutaguchi @mutaguchi@fedibird.com

https://note.com/kogu_dev/n/n95b25be05f35
生成AIを使って「自分が創作した」という気分（著作権とかの話ではない）を得るには、まず生成AIと対話的にがっつり世界設定を作り込んで、その情報をプロンプトとして与えて、生成AIに生成させると良いのでは、という方法論。

+ 2024年12月23日 06:47

mutaguchi @mutaguchi@fedibird.com

新交通システムとか鉄道の自動運転とかは、無人でもむしろ安心まであるんよね。
自動運転車だけの専用軌道というのは、不確定要素が少なく、確実性が担保されるプログラム動作に最適だから。

スレッドを表示

古いものを表示

X: https://x.com/mutaguchi

write only

2023年 7月に登録