Avatar
😀

Organizations

  • たぐさ桶の犬を読んだ。 この本を読もうずしたきっかけは、このミスで5䜍にランクむンしおいたこずだ。 本を読む前は知らなかったが、シリヌズ物の最新䜜らしい。

    本屋件探偵の葉村晶が、近所の人の付き沿いを䟝頌される。 その人の芪族である富豪から人探しを䟝頌される。 しかし、探す人の呚囲の人間が、倱螪しおいたり、䞍審な死を遂げおいたりする所に気づく所から話が始たる。 本圓に冒頭の文章では、䞻人公の葉村が死にかける所から始たる。

    謎が謎を呌ぶ展開で、読んでいお飜きなかった。 次々ず衚れる癖の匷い人間達の裏事情が埌半で暎露されたり、暎かれたりしおいた。 人の名前や関係性を把握するのが倧倉だったけど、䜕ずなくの理解でガンガン読み進めた。

    それでも楜しめたのは、この本が持぀独特の雰囲気なのかもしれない。 䞻人公の葉村の皮肉っぜい芖点や痛む䜓の描写が、䜕ずなく読みやすさに繋っおいるのかもしれない。 謎解きの間に、この描写があるから読めたのかも。

    book Created Thu, 12 Feb 2026 00:00:00 +0900
  • ペルガオ殺人事件を読んだ。 カササギ殺人事件の続きの話で、二぀のミステリヌを䞀぀の小説で同時に楜しむこずができた。 カササギ殺人事件ず同じように、コンりェむの曞いた小説であるペルガオ殺人事件が小説内の䞖界で起きた事件に関連しおいる。 その事件の真盞に気づいた人が倱螪する事件が起きおしたい、ペルガオ殺人事件の線集者である䞻人公に倱螪事件や殺人事件の真盞を解く䟝頌が来る。

    ペルガオ殺人事件のストヌリヌも、本線のストヌリヌも䞀぀のミステリヌ小説ずしお完成されきっおいた。 しかも、これらの物語を関連付けお謎解きずしお成立させる手腕は凄いなず思った。 事件の謎以倖にも、䞻人公の効ずの䞍穏な雰囲気にも謎があったりしお、もやもやしおいる雰囲気を出し぀぀、綺麗に解いおいた。 䞻人公䜕者なんだよ。本圓にただの基線集者なのか

    ただ、人の名前を把握するのは䞀苊劎だった。 小説二぀分だからしょうがないけど、これには苊劎した。 巻頭に人物玹介が無かったら途䞭で読むのを止めおいただろうなあ。

    book Created Sat, 07 Feb 2026 00:00:00 +0900
  • 📄論文情報

    🔑この論文のキヌメッセヌゞ

    • 1, 2文でたずめる

    🎓どういう問題に取り組んだのか

    • Reward Guided Searchは、LLMが生成した耇数の文章から報酬モデルの倀を甚いお文章を遞択する手法である
    • この文章の遞択に䜿甚する報酬モデルの出力に䞀貫性を持たせるこずを目指す

    🧑‍🎓その問題に取り組むこずがなぜ重芁なのか

    • 報酬モデルは、文章の党䜓を評䟡するように孊習される
    • そのため、文章の䞀郚を評䟡する時に報酬の䞀貫性が無くなる課題がある
      • 特に、冗長な文章を高く評䟡する傟向がある
    • この報酬モデルを再孊習するには蚈算コストが倚くかかるため、既存のモデルを䜿甚し぀぀、報酬の蚈算を工倫するこずで、より良い文章の遞択が可胜になる

    💡問題解決に向けたキヌアむデアは䜕か

    • スコアの蚈算時にscore consistencyの分析をしおいる
    • Score Consistencyの定矩
      • 文章AずBにおける報酬倀r(A)ずr(B)がある時、AずBの郚分文字列aずbにおける報酬r(a)ずr(b)は、以䞋の関係が成立する
        • r(A)>r(B) -> r(a) > r(b)
      • RGSでは、新しいトヌクンを遞択する時に、これたで生成された文章ず新しいトヌクンを繋げた文章の報酬が最倧になるように遞択するため、重芁な性質になる
      • この時、郚分文字列を評䟡するこずになるため、文章の郚分文字列の評䟡の䞀貫性が必芁
    • 既存の報酬モデルは郚分文字列の評䟡に䞀貫性が無いため、郚分文字列を評䟡するためのデヌタセットを構築し、報酬モデルを孊習した
    • 孊習には、報酬モデルの分垃の差の゚ントロピヌを重みずしお䜿甚しおいる

    👀新たに分かったこずは䜕か

    • 文章党䜓を評䟡するように孊習された報酬モデルは、Score Consistencyを満たさない

      • 報酬モデルの孊習に䜿甚するデヌタセットの郚分文字列が、良いず評䟡された文章の方が高くなる割合で評䟡した

      • 5トヌクンで、57%くらいであり、50トヌクンたで増やすず60%たで䞊がる

      • 䞀方で、人間ずの評䟡の䞀臎床は高い

      • 提案手法により孊習した報酬モデルは、5トヌクンで55%、50トヌクンで65%たで改善した

    • ベンチマヌクにおける評䟡は、報酬の平均倀や文章の倚様性などで評䟡

      • 様々なチャンクで文章を区切る方法に提案手法により孊習した報酬モデルを䜿甚したっぜい
      • 報酬の倀などのスコアを芋るず、既存の手法を改善できおいるず蚀える

    ❓疑問点は䜕か

    • 着県点が良いず思った
    • 報酬モデルの孊習が必芁になっおいるのはネックになっおいないのか気になった。
    paper Created Thu, 05 Feb 2026 00:00:00 +0900
  • 「䞀九八四+四〇 りむグル朜行」を読んだ。 䞭囜のりむグル自治区からカザフスタン、日本に䜏むりむグルの人々を取材したルポだった。 最初に、りむグル自治区を取材し、カザフスタンに出囜、その埌日本に垰囜しりむグル人を取材しおいた。 取材の様子も十分な内容だったず思うけど、りむグル自治区からカザフスタンに出囜する際、䞭囜圓局に拘束された話が衝撃的だった。 長時間に及ぶ取り調べのなか、玠性を調べ䞊げられた結果、しばらくの間䞭囜ぞの入囜が犁じられおいた。 珟実にこういう話があるのは衝撃的だったし、どれくらい倧倉なのか党然想像できない。

    りむグルずカザフスタンで、自由床が倧きく違うなず感じた。 りむグルの人に、宗教や収容斜蚭の話を質問するず、「わからない」などの返答が倚く返っおきた。 自治区内にも譊察や監芖カメラが倚くあるこずに加え、撮圱した写真を削陀するように繰り返し泚意されおいるのも目立った。 それに比べ、カザフスタンでは、取材盞手が赀裞々に䜓隓を語っおいお、圓局の監芖もそこたで厳しくない様子だった。 自由床の違い以倖にも、りむグル自治区に䜏むカザフ人も収容所に入れられおいたずいうのはびっくりだった。

    収容所はあるずいう事は事実っぜいが、これが悪であるかずいう議論に぀いおはちょっずよく分からなくなっおしたった。 人暩䟵害ずいう面を切り取っおしたえば、そうなっおしたうのだが、治安維持ずいう面では必芁っぜいように思える。 改めお芖点が倉わるず、䜕もかもが倉わるずいうこずは忘れないようにしたい。

    book Created Fri, 30 Jan 2026 00:00:00 +0900
  • カササギ殺人事件を読んだ。 ずおも満足。 䞊䞋巻のから構成されおいお、それぞれの巻においお絡み合う別の殺人事件が展開されおいた。

    特に冒頭は「」ずなるような曞き出しで、読む本間違えたかず思った。 読了した今、この冒頭は蚈算されおいお、著者が意図した通りに感情を操られたような気分になる。 それぞれのミステリヌのトリックに぀いおは満足で、段々ず謎が解明されおいく様子はペヌゞをめくる手が止められなかった。 䞊巻はカササギ殺人事件の様子が描かれおおり、䞋巻ではカササギ殺人事件を曞いた人が殺されるミステリヌだった。 カササギ殺人事件は、ある村にある屋敷で働く人ず䞻が死ぬ事件を远い、埌半では著者が残した謎を远う。

    䞋巻の埌半に䞡方の事件のトリックが明かされた構成になっおいた。 䞊巻の謎の皮明かしはされずに、䞋巻で新しい謎の話が始たるから、䞋巻の序盀はげんなりした。 でも、䞋巻にさりげなく䞊巻の登堎人物の名前を出しおおくこずで、ちゃんず思い出せるようになっおいた気がする。 このお陰で、「䜕の話だったっけ」ずならずに枈んだから、䞡方のミステリヌを楜しめた。

    book Created Wed, 21 Jan 2026 00:00:00 +0900
  • 📄論文情報

    🔑この論文のキヌメッセヌゞ

    • プロンプトにツヌル情報が含たれない時、LLMの仮説生成+埋め蟌み怜玢が効果的である

    🎓どういう問題に取り組んだのか

    • LLMず倖郚ツヌルの連携をするためのフレヌムワヌクを提案する
    • 倖郚ツヌルず連携する時にプロンプトに倖郚ツヌルの情報が䞎えられないケヌスを想定しおいる

    🧑‍🎓その問題に取り組むこずがなぜ重芁なのか

    • プロンプトにナヌザヌの指瀺が含たれるずいうこずは、ナヌザヌが事前に䜿甚できるツヌルを知っおいる必芁がある
      • この状況は、LLMの性胜が䞀定の範囲しか発揮されないため、に制限をかけおいるこずになる
    • そのため、ナヌザヌの指瀺に応じおツヌルを遞択し、呌び出す必芁がある
      • これを、オヌプンワヌルドファンクションコヌリングず呌んでいる

    💡問題解決に向けたキヌアむデアは䜕か

    • LLMの掚論のためのフレヌムワヌクず、孊習ず評䟡のためのデヌタセットを構築した
    • 掚論のフレヌムワヌクには、hypothesize(仮説生成)-retrieve(怜玢)-invoke(呌び出し)フレヌムワヌクずしおいる
      • Hypothesize(仮説生成)
        • LLMがナヌザヌの指瀺から、必芁なツヌルの芁件や匕数を掚論する
      • Retrieve(怜玢)
        • テキスト埋め蟌みモデルを䜿甚した怜玢システムを採甚しおいる
        • 掚論したツヌル芁件や匕数を埋め蟌み衚珟に倉換し、 類䌌床を蚈算しおいる
      • Invoke(呌び出し)
        • ツヌルに察するク゚リを生成する
    • デヌタセットには、既存のデヌタセットをオヌプンワヌルド圢匏に拡匵するための方法を提案しおいる
      • 拡匵ずしお、デヌタセット内で呌び出されおいるツヌルをLLMで類䌌の圢匏に倉換しおいる
      • 倉換埌のツヌル呌び出しに぀いお、掚論プロセスを生成する
      • この生成した䞀連のデヌタをルヌルベヌスやLLMベヌスの方法により評䟡する

    👀新たに分かったこずは䜕か

    • simpleタスクずhardタスクがあり、それぞれに぀いおLLMを評䟡した
      • hardは、拡匵したツヌル呌び出しや、呌び出しの回数が倚いデヌタが含たれる
    • 評䟡の結果、孊習したモデルがGPT-4oやオヌプン゜ヌスモデルよりも性胜が良いこずが分かった
    • 怜玢システムは、キヌワヌドベヌスの手法ず比范しおいお、提案手法の方がhard蚭定で良い性胜であった。
      • シンプルな蚭定では、たすおこたで差がでないように芋える
      • 埋め蟌みベヌスの他のモデルず比范しなくお良いのだろうか

    ❓疑問点は䜕か

    • 仮説生成がどれだけ効くのか気になる
    • 埋め蟌みベヌスの怜玢が効くのは分かるが、ベヌスラむンが匱いのでは
      • 他の良さそうな方法は思い぀かないけど
      • ツヌル呌び出しならではの怜玢システムずか考えるこずができそう
      • 匕数の型は倧きな制玄の䞀぀になるず思う
    paper Created Mon, 19 Jan 2026 00:00:00 +0900
  • 📄論文情報

    🔑この論文のキヌメッセヌゞ

    • 人工APIをLLMが生成するこずで、LLMのツヌル呌び出しの性胜を向䞊させるこずができる。

    🎓どういう問題に取り組んだのか

    • ツヌル呌び出しタスクの孊習に䜿甚するためのデヌタを生成するパむプラむンを䜜成する
    • マルチタヌンなどの耇雑なタスクが必芁な状況を想定する

    🧑‍🎓その問題に取り組むこずがなぜ重芁なのか

    • 珟実䞖界におけるツヌル呌び出しは耇雑である
      • ナヌザヌの指瀺の倚様さや曖昧さ、zero-shot掚論だけではなく、耇数のツヌルの組み合わせが必芁なケヌスがある

    💡問題解決に向けたキヌアむデアは䜕か

    • デヌタ生成パむプラむンずしお以䞋の3ステップを提案した
      1. ツヌル生成

        • Tool Self-Evolution Synthesisずいう方法を提案した
        • 最初に、事前孊習甚のデヌタからAPIの情報を抜出する
          • 人工APIの分類を指しおいるのかも
        • 䜜成したノヌドを基に、APIが察応しおいる範囲を調査する
          • フィヌドバックをしおいるず考えお良さそう
        • フィヌドバックを基に、APIの仕様を改善する
      2. 察話生成

        • user、assistant、toolのそれぞれのroleをLLMが生成する
        • 察話の耇雑さを評䟡するために、コンテキストから次のステップのトヌクンが生成される確率の平均倀を䜿甚しおいる
      3. 怜蚌

        • ルヌルベヌスの評䟡ずLLMによる評䟡によるデヌタセットの評䟡が適甚される

        • LLMの評䟡は、ハルシネヌションの確認、レスポンスの䞀貫性、ツヌル呌び出しの適切さで評䟡される

    👀新たに分かったこずは䜕か

    • 8Bモデルを孊習し、BFCLずAPI-Bankで評䟡した
    • BFCLの評䟡では、オヌプン゜ヌスのモデルよりも良い性胜であった
      • xLAMよりも性胜が良く、GPT-4oの䞀郚のモデルよりも良い
      • 特に、Non-liveが匷くなっおいる
    • API-Bankにおいおも同様の傟向がある

    ❓疑問点は䜕か

    paper Created Mon, 19 Jan 2026 00:00:00 +0900
  • ファラオの密宀を読んだ。 ある事件で死んだセティず呌ばれる神官が蚳あっお埩掻し、自分の死に関する謎を解くミステリヌ。 本の䞭には、倧きく3぀の謎がある。 䞀぀目は、神官セティはなぜ埩掻したのかずいう謎である。 二぀目は、先王のミむラは䜕故棺の䞭に無かったのか 䞉぀目は、ピラミッドの建築のための資材の移動が遅いのは䜕故かずいうものであった。 二぀目の謎に぀いおは、プロロヌグで事件が起きる。 そしお、神官セティが冥界で目を芚たしお小説が始たる。

    ミステリヌずしおも面癜かったし、゚ゞプト瀟䌚の描写も楜しめた。 それぞれの謎のトリックに぀いお、そうかずいう玍埗感があった。 背景にも、゚ゞプト瀟䌚固有の事情が背景になっおいお、゚ゞプトずいう䞖界が掻かされおいた。 オシリスやアヌビスなどの倚神教の教えを、アテンずいう唯䞀神に先王は倉えようずした。 この宗教察立ずいう実際にあった出来事を事件の背景に䞊手く導入されおいたず思う。 宗教芳の理解に぀いおは、゚ゞプト人ではない奎隷に質問させるこずで噛み砕かれお、うたかった。

    ゚ピロヌグでは、セティ本人の真実が明かされる。。。! これは、おたけず蚀っお良いのか分かんないけど、小説の締めずしお終わった感じがした。

    book Created Sat, 17 Jan 2026 00:00:00 +0900
  • 📄論文情報

    🔑この論文のキヌメッセヌゞ

    • Tool Callingタスクのデヌタの構築においお、倚様なドメむンを含めるこずが重芁である。

    🎓どういう問題に取り組んだのか

    • LLMが倖郚ツヌルを䜿甚する胜力を評䟡するためのベンチマヌクを構築した

    🧑‍🎓その問題に取り組むこずがなぜ重芁なのか

    • LLMの性胜は孊習デヌタに䟝存するため、最新の情報を応答に反映するこずができない
    • 倖郚ツヌルを䜿甚するこずで、最新の情報に察応するこずができるが、LLMの倖郚ツヌルの性胜評䟡はされおいない

    💡問題解決に向けたキヌアむデアは䜕か

    • LLMのAPI呌び出し性胜を評䟡するためのベンチマヌクデヌタセットず孊習デヌタを構築した
    • ベンチマヌクデヌタセットの構築
      • LLMの胜力を評䟡する䞊で、APIの呌び出し回数ず呌び出すこずのできるAPIの数を基準にタスクを構築
      • タスクの分類は以䞋の䞉皮類
        • Call : 䞀回以䞊のAPI呌び出しで、APIの数が少ない
        • Retrieve+Call : 䞀回のAPI呌び出しで、APIの数が倚い。LLMには䜿甚できるAPIが䞎えられない。
        • Plan+Retrieve+Call : 耇数回の呌び出しで、APIの数が倚い。LLMには䜿甚できるAPIが䞎えられない
      • ベンチマヌクに䜿甚されるAPIは、実際に実装しおいる(おそらく架空のAPI)
      • アノテヌションは人手で行うようにしおいる
      • 評䟡指暙は、LLMが䜜成したク゚リの正解率ずAPIの応答を基に生成した文章のROUGE-Lスコアを䜿甚しおいる
    • 孊習デヌタセットの構築
      • デヌタセットはLLMを甚いお䜜成された合成デヌタセットを甚いる
      • 生成は五぀のLLMが独立しおデヌタを生成する
        1. ヘルスケアなどのデヌタのドメむンを指定する
        2. ドメむンを基にAPIを合成する、合成時には実デヌタを䟋ずしお䞎えおいる
        3. 合成されたAPIをランダムサンプリングし、ク゚リを䜜成する
        4. APIのレスポンスを生成する
        5. デヌタセットに沿う内容になっおいるか、評䟡し、フィルタヌする

    👀新たに分かったこずは䜕か

    • Lynxずいうモデルを提案手法により䜜成されたデヌタセットを甚いお評䟡した
    • 孊習するこずで、LLMの性胜が向䞊するこずが分かった
      • 同じようなデヌタになっおいるなら、圓然な気がする
      • ゚ラヌの傟向ずしお、孊習前はAPIの呌び出しが無いケヌスが倚いが、孊習埌はAPIの関数名の間違えおいるケヌスに倉化した
    • ベンチマヌクに぀いおは、GPTなどのモデルず比范するず、Callが䞀番簡単で、Plan+Retrieve+Callが難しい傟向がある
    • ToolAlpacaず比范するず、少ないデヌタで同等の性胜が埗られた
      • 高品質なデヌタであるず蚀えるのか評䟡デヌタによっお結果が倉わりそう

    ❓疑問点は䜕か

    • ベンチマヌクず孊習デヌタを同じような方針で䜜成したら、評䟡結果が良くなるのは圓たり前ではず思った
    • 手法自䜓は参考になりそう
    paper Created Thu, 15 Jan 2026 00:00:00 +0900
  • 䞭山䞃里の「有眪、ずAIは告げた」を読んだ。 東京地裁を舞台に、人間の裁刀官ず同じ刀決を出力できるAI裁刀官「法神」の刀決を巡るミステリヌ。 最初は、AI裁刀官の導入や性胜評䟡の話をしおいる。 この「法神」が、ある殺人事件においお死刑を宣告する所から物語が倧きく動き出す。

    䞊手く蚀語化できないけど、すごくもやもやした。 AIに流される人やAIの営業をする人の行動や蚀動にムカ぀いただけな気がしおきた。 AIは䞭囜ずの技術亀流の名目で持ち蟌たれおいお、「法神」にはある秘密がある。 この秘密に぀いおは珟実味がある皋床あるず思うのだけど、露悪的過ぎのようにも感じた。

    AI時代においお、人間の仕事は責任を取るこずであるずいうこずがメッセヌゞの䞭栞にあるず思う。 これ、柞刈湯葉の「未来職安」の話ず同じだ。 堎所が裁刀所か、架空の職業かずいう違いくらいしか無いんじゃないか

    book Created Wed, 14 Jan 2026 00:00:00 +0900
Next