しかしなー、とにかく、ARC-AGIの問題、IQテストにも満たない、子供向けの塗り絵レベルの問題集で、こんなの人間なら時間かければ誰でも解けるよね。
平均的な人間なら75%しか解けないと言われてるのは何なんだろう。グラフではAvg. Mturkerが75%くらいの正答率になってるけど、これってAmazon Mechanical Turkという人力でマイクロタスクをやってもらうクラウドソーシングサービスで得られる、平均的な解答品質という意味で、これを平均的な人間の能力と見做すのは流石に無い。
これをAGIがどうとかの評価基準にするのは、やっぱり馬鹿げてる。しかも、推論時間スケーリング準拠だから、数時間とかのオーダーで時間かけて、解けたからAGI?いやいや、と。 [参照]
https://x.com/optozorax/status/1870332502847476005
お、o3は実際、こっちの解を提出して間違い判定を食らったのか。
うん、o3くんが正しいと思うよ私もw
https://arcprize.org/arc-agi-pub
https://x.com/Mnestick/status/1870198659821842435
o3が50万円かけて解いた問題、こんなんらしいんですよね。ベンチマークだからというのは百も承知だけど、こんな問題、人間なら一瞬…とはいかずともちょっと何分か考えたら分かることだし、LLMに何時間か何日かしらんがかけて、無理に解かせる必要性を全く感じないわね。こんな問題、言語化して解く系の問題じゃないだろうと。
直感で法則みつけて、その直感が合ってるのか検証するタイプの問題で、LLMにとって明らかに苦手な問題だしなぁ。
https://note.com/1230yuji/n/n55f70e420b14
これ読んで把握した。にじボイスの運営会社Algomaticは、DMMから出資を受けているから、サービスにDMMの名前を最初は使っていたけど(?)、今は独自ブランドにしたいから、名称変更した。
でも生成AI技術は日進月歩だから、サービスを作ったらすぐに次を作らないといけない。そのために、作ったサービスの事業責任者を業務委託契約で募集して、全ての業務をその人に任せる、ということをしている(したい)らしい。
うーん、なんだそれ…これじゃ安定したサービス運営なんて全く期待できないな。にじボイスに未来なさそう。
https://x.com/1230yuji/status/1870432686986416469
これ誰に向けて言ってるんだろう?
にじボイスってDMMのサービスではないの?
https://x.com/masumi_asano/status/1870283019011170566/history
おそらく内反小趾だろうから、最初の足専門病院Aが一番まともな対応な気がする…。インソール1足5万円、保険効くはずだし患者負担は1.5万円くらいよな。
整体は論外として、恐らく自由診療の歩き方矯正コースを初手で勧める足専門病院Bはなんだそれ感あるけど。
しかし患者が本当に求めるものは、お金もかからんし辛い治療も必要ない、近所の小さな整形外科がしてくれる、即効性の対症療法なんだよなぁ…