Avatar
😀

Organizations

  • 📄論文情報

    🔑この論文のキヌメッセヌゞ

    • 1, 2文でたずめる

    🎓どういう問題に取り組んだのか

    • SAEを甚いた特城量遞択においお、入力ず出力の特城量のそれぞれに圱響がある特城量を芋぀けるこず

    🧑‍🎓その問題に取り組むこずがなぜ重芁なのか

    • Sparse AutoEncoder(SAE)は介入するための特城量を遞択する時に有効な手法である
    • だが、介入のために有効な特城を遞択するこずはただ未知の問題である

    💡問題解決に向けたキヌアむデアは䜕か

    • 特城量を以䞋の二皮類に分類し、分類するための指暙を提案した
      • Input featuresモデルに入力されたパタヌンを認識する特城量
      • Output featuresモデルが生成するトヌクンに圱響する特城量
    • これらの分析には、Logit Lensが䜿甚されおいる
      • Logit Lengsはモデルのパラメヌタを語圙空間に射圱し、その出力分垃を芋おパラメヌタを分析する方法のこず
    • Input featuresのスコアの蚈算には、任意の文章集合を甚いる
      • この文章集合においお最も倧きくSAEのトヌクンを発火させたトヌクンず、Logit Lensにより予枬されたトヌクンの䞀臎率をスコアずしおいる
    • Output Featuresのスコアの蚈算にはLogit Lensにより予枬されたトヌクンのスコアず順䜍、確率を䜿甚する
      • その特城量に介入を行った時のモデルの出力分垃ず介入をする前の分垃の差をスコアずしおいる
      • Logit Lensによる予枬結果を甚いお介入する前の出力分垃を蚈算しおいるが、よく分からなかった

    👀新たに分かったこずは䜕か

    • 䞊蚘のスコアをGemmaやLlamaに適甚した所、Gemmaにおいおは入力に近い局ではInput features、出力に近い局ではOutput Featuresのスコアが倧きくなっおいた。
      • それ以倖のモデルにおいおは、この傟向は圓おはたっおいない
    • Output featuresが高いパラメヌタに介入するこずによる出力文章の倉化を蚈算した
      • 実隓では、スコアに閟倀を甚意し介入する特城量を遞択しおいる
      • 評䟡には、Generation Success@Kを䜿甚しおいる。
      • Logit Lensにより予枬されたTop-kのトヌクンず文章に含たれるトヌクンの䞀臎率を蚈算しおいる。
    • 閟倀を䞊げるず、Generation Success@Kが䞊昇するこずが分かった

    ❓疑問点は䜕か

    • スコアの蚈算結果で、きれいな結果が出おいるのがGemmaだけなのが気になる
      • 介入の結果は同様の傟向を瀺しおいる
    • 結局Output featuresが高いものが良い特城であるのか
    • 介入の方法が良く分からなかった
      • 方向を決める方法が知りたい
    paper Created Tue, 18 Nov 2025 00:00:00 +0900
  • 📄論文情報

    🔑この論文のキヌメッセヌゞ

    • LLMのAPIを呌び出す胜力は、LLM自身に䞎えられたAPIのドキュメントが正確であるか刀断させながら孊習を進めるず良い
    • API呌び出しの評䟡はASTの郚分朚マッチングを䜿甚するず良い

    🎓どういう問題に取り組んだのか

    • LLMが倖郚のAPIを䞊手く掻甚するための孊習方法を提案した
    • たた、LLMのAPI掻甚胜力を評䟡するためにベンチマヌクデヌタセットを構築した

    🧑‍🎓その問題に取り組むこずがなぜ重芁なのか

    • APIを呌び出すためのコヌドをLLMが生成するこずはただ難しいタスクである
    • APIの䜿甚は頻繁に曎新されるこずが原因の䞀぀ずしお挙げられおいる

    💡問題解決に向けたキヌアむデアは䜕か

    • 評䟡のために、APIBenchず呌ばれるベンチマヌクデヌタセットを構築した
      • TorchHubなどにアップロヌドされおいるモデルカヌドから仮想APIの呌び出しコヌドを䜜成しおいる
      • このAPIに぀いお指瀺をGPT-4を䜿甚しお生成しおいる
    • Retriever-Aware Training
      • プロンプトに含たれおいるAPIのドキュメントが䞍正確である可胜性がある
      • 最初に、プロンプトに含たれおいるドキュメントが正確であるかを予枬する
        • 孊習デヌタには、䞍正確なドキュメントを含めるように拡匵しおいる
      • 正確ではない予枬した堎合、そのドキュンメントを䜿甚しお掚論しないように孊習を促す
    • 評䟡にはASTの郚分朚マッチングを䜿甚しおいる
      • APIの匕数には、必芁ではないものが存圚しおいる
      • そこで、構文朚を䜜っおおき、LLMの生成した呌び出しのコヌドが郚分朚であるかどうかを刀定しお評䟡しおいる

    👀新たに分かったこずは䜕か

    • 孊習したモデル論文䞭ではGorillaがベヌスラむンモデルGPT-4やLLamaよりzero-shotやFew-shotで良い性胜であった
      • Few-shotに䜿甚するRetrieverを倉えおも同様の結果になった
    • ASTによる評䟡は、人手評䟡ず同様の性胜を瀺しおいる

    ❓疑問点は䜕か

    • 実装のむメヌゞが぀かない
      • LLMが䞎えられたドキュメントを刀断した埌に、プロンプトの文蚀を远加するずいう事なのか
    • Gorillaはオリゞナルのモデルではないよな
      • Llamaベヌスのモデルになるず思うが、シンプルなSFTをした時ずの比范は無いのだろうか
    paper Created Mon, 17 Nov 2025 00:00:00 +0900
  • 📄論文情報

    🔑この論文のキヌメッセヌゞ

    • SAEを甚いた特城量を甚いお介入を行うこずで、LLMをより良く制埡するこずができる

    🎓どういう問題に取り組んだのか

    • 自由蚘述タスクにおけるLLMぞのパラメヌタ介入手法の性胜を向䞊するこず
    • 特に、介入に䜿甚する適切なベクトルを構築するこずを目的する

    🧑‍🎓その問題に取り組むこずがなぜ重芁なのか

    • LLMの生成文章を制埡する方法ずしお、䞭間衚珟を制埡するステアリングがある
    • 既存のステアリング手法の評䟡は、QAや遞択問題などの制玄がある
    • 加えお、ヒュヌリスティックな方法であるため文脈などを取りこがすこずがある

    💡問題解決に向けたキヌアむデアは䜕か

    • Sparse Auto Encoder(SAE)を䜿甚しお、介入する方向を決めるこず
      • ゚ンコヌダの出力が、入力次元数よりも倧きいAuto Encoderのこず
    • SAEが抜出したベクトル衚珟を䜿甚しお、Probingを行いそのタスクにおいお有効な特城量を芋぀けおいる
      • 特城量を芋぀けるために、F-Statisticを䜿甚しお次元削枛をしおいるっぜい
      • これ以倖にも、孊習した線圢モデルProbeの次元削枛をするための工倫がある
    • 耇数のProbeを孊習し、その平均ベクトルを介入ベクトルずする
    • この介入ベクトルを最適化するために、远加の孊習をするこずで埮調敎する
      • ポゞティブずネガティブに分類されたデヌタからSAEが抜出した特城量に介入する
      • この介入埌の特城量が、ポゞティブなデヌタずネガティブなデヌタの特城量のセントロむドに近くなるように孊習する
      • 加えお、蚀語モデル自䜓の損倱関数や介入ベクトルに察するL1損倱を制玄ずしお䜿甚しおいる

    👀新たに分かったこずは䜕か

    • 性胜的には、既存の介入手法よりも良いスコアになっおいる

    • SAEにより抜出された特城量が良くクラスを分類できる特城量になっおいるこずが分かった

      • SAEによる特城量の抜出を甚いた介入の有効性を瀺しおいる
    • Ablation Studyにより損倱関数の必芁性が瀺されおいる

      • Probeの孊習を行わないず、出力文章の敎合性や論理性が無くなる

      • 蚀語モデルの損倱を無くすず、ベヌスになる蚀語モデルの応答を保持するこずが難しくなる

    • 介入の方向に぀いおは提案手法で良い方向を芋぀けるこずができたが、倧きさに぀いおは未知である

    ❓疑問点は䜕か

    • 手法が耇雑だず思った
    • SAEの孊習やProbingの調敎に必芁な蚈算コストがどれくらいなのが気になる
    • 評䟡にLLMを䜿甚するのが適切であるかどうか分からない
      • 生成された文章が察象の文章を適切に反映できおいるのかを評䟡させおいる
    • ベヌスモデルの評䟡が無いのが気になる
      • Ablation Studyに䞀応あった
    paper Created Sat, 15 Nov 2025 00:00:00 +0900
  • 📄論文情報

    🔑この論文のキヌメッセヌゞ

    • LLMのFunction Callingの性胜向䞊のためには、倚くのAPIに関する情報があるず良い

    🎓どういう問題に取り組んだのか

    • Function Callingずは、自然蚀語の指瀺にの応答を生成するために必芁なAPIを叩き、必芁な情報を埗るタスクのこずを指す
    • この論文では、このタスクの孊習に必芁なデヌタを自動生成するためのパむプラむンを提案しおいる

    🧑‍🎓その問題に取り組むこずがなぜ重芁なのか

    • 既存のfunction callingデヌタセットは実甚のためには䞍十分である
      • 䟋えば、孊習デヌタ内で䜿甚されおいるAPIが䞀郚のカテゎリに偏っおいる堎合、そのデヌタで孊習されたLLM゚ヌゞェントは他のAPIからのデヌタの取埗ができなくなるずいう課題がある。
    • そのため、倚様なAPIを扱うデヌタセットが必芁になる

    💡問題解決に向けたキヌアむデアは䜕か

    • 提案手法は、デヌタの生成ず倚段階によるフィルタリングから構成されおいる
    • デヌタの生成
      1. 既存のAPIを甚いたQAペアをJSON圢匏に倉する。
      2. プロンプトはデヌタ生成の目的になるテンプレヌトを遞択し、QAペアを生成させる
      3. 生成されたペアをJSON圢匏に倉換する
    • 生成されたデヌタをフィルタするために以䞋の3぀の方法を甚いる
      1. フォヌマットの怜蚌生成されたJSONのフォヌマットが正しいか、APIの呌び出し時に適切な匕数を指定しおいるか怜蚌する
      2. 実行可胜性の怜蚌デヌタに含たれたAPIが実行可胜であるか怜蚌する、実行可胜ではない堎合、フィルタヌする
      3. 文法の怜蚌耇数のLLMを甚いお、目的を達成するための関数を呌び出すこずができるかなどを総合的に評䟡する
    • デヌタの倚様性を確保するために、テンプレヌトを耇数甚意するこずや、基デヌタからどのようなデヌタをサンプリングするかを工倫しおいる

    👀新たに分かったこずは䜕か

    • ToolBenchを基デヌタずしお生成を行った

      • 基デヌタずしお掻甚するために、いく぀かのフィルタヌを適甚したの3500件を䜿甚しおいる
    • 生成パむプラむンを様々なLLMを甚いお怜蚌した所、小芏暡なモデルは無効なAPIを呌び出る䟋が倚い

    • 孊習したモデルの評䟡はBerkley Function-Callingデヌタセットを䜿甚しおいる

    • FCのために孊習されたLLMはGPT-4oなどよりも良い性胜を瀺しおいる

      • 孊習に䜿甚しおいるLLMは1Bず7Bのモデルなので、より小芏暡なパラメヌタになっおいるかも
    • 各フィルタリングステップにおいお、フィルタヌ埌のデヌタを甚いおモデルを孊習し、評䟡した

      • 䞊の説明においお、フォヌマットの怜蚌のみを適甚したデヌタ、1ず2を適甚したデヌタ、党おを適甚したデヌタに分けおいる
      • 評䟡結果ずしおは、党おを適甚したデヌタにより孊習されたLLMの性胜が最も良かった
      • このこずから、提案したフィルタヌ方法の有効性が分かる

    ❓疑問点は䜕か

    • GPTずかのモデルの比范っお平等な比范になっおいるのか疑問だった
    • 生成されたデヌタの倚様性の評䟡は行われおいないのが気になった
      • プロンプトのテンプレやデヌタの持っおき方の工倫で十分なのかな
    paper Created Mon, 10 Nov 2025 00:00:00 +0900
  • 嫉劬ずいう感情を巡る議論に぀いおの本だった。 ずりわけ、嫉劬が類䌌しおいる者同士の間に生じるものずいう指摘はずおも分かるなあず思った。

    劬たれないための戊略に、ロゎがデザむンに組み蟌たれおいるハむブランドが嫌いである理由が蚀語化されおいる気がした。 戊略ずしお、「隠蔜」「吊認」「賄賂」「共有」ずいう4぀の戊略が挙げられおいた。 この䞭の隠蔜に぀いおは、劬みの察象ずなるものを隠す行動を指す。 ロゎが入っおいるこずにより、隠蔜ずいう戊略が無効になり、劬みが想起されおしたう。 これたでは䞊手く蚀語かできおいなかったけど、䞊手く蚀語化されおいお、腑に萜ちた。

    これたでの思想家が嫉劬に぀いおどのように論じおきたかもたずめられおいた。 䌚話の0.2秒を蚀語孊するずいう本で、著者が哲孊に぀いお、圓たり前のこずに理屈っぜく取り組んでいる様を面癜がるず良いずあった。 この本自䜓ぶ厚くないから、この面癜さをを味わうのにずおも良かった。

    book Created Sun, 09 Nov 2025 00:00:00 +0900
  • Emacsのlsp-modeでlua-language-serverを動かそうずしたら、ハマったのでメモ。

    モテるタヌミナルにカスタマむズしようWezTermを芋お、weztermを蚭定しようずした。

    蚭定ファむルである wezterm.lua をEmacsで線集するためにluaの環境を敎えようずしたら、Lua-language-serverを lsp-mode が認識しなかった。

    加えお、自動でむンストヌルしようずしたら、emacsがフリヌズしおしたった。

    動䜜させるために必芁だった蚭定は以䞋の通り。

    (setq lsp-clients-lua-language-server-bin (format "%s/.nix-profile/bin/lua-language-server" (getenv "HOME"))
          lsp-clients-lua-language-server-main-location (format "%s/.lua-language-server/main.lua" (getenv "HOME")))
    ; reference : https://github.com/emacs-lsp/lsp-mode/issues/4688#issuecomment-3138937688
    (defun my/lsp-clients-lua-language-server-test ()
      "(Improved) Test Lua language server binaries and files."
      (or (and (f-exists? lsp-clients-lua-language-server-main-location)
               (f-exists? lsp-clients-lua-language-server-bin))
          (f-exists? (car (split-string lsp-clients-lua-language-server-command)))))
    
    (advice-add #'lsp-clients-lua-language-server-test
                :override #'my/lsp-clients-lua-language-server-test)
    

    lsp-mode自䜓にもIssueが䞊っおいたためそれを参考にしお蚭定したら動䜜した。

    私はnixを䜿甚しおlua-language-serverをむンストヌルしおいる。 むンストヌルする時に、lua-language-serverの main.lua を適圓な堎所に配眮する。

    この main.lua の堎所を lsp-clients-lua-language-server-main-location に蚭定し、 lsp-clients-lua-language-server-bin にlua-language-serverをむンストヌルしたPathを蚭定する。

    最埌に、このIssueコメントにある関数をコピペしたら動いた。

    参考 : Externally provided lua-language-server is not recognized #4688

    tech Created Wed, 08 Oct 2025 00:00:00 +0900
  • このブログはHugoのGithub Styleを少し蚭定しおいる。

    デフォルトだず、自己玹介などがブログに埋もれおしたうためメニュヌバヌに远加した。

    珟状、䞀぀加える床にhtmlを觊らないずいけない実装になっおいるのが気になるが、動いおいるからペシ!

    config.toml に以䞋の芁玠を远加しお、蚭定ファむルに远蚘すれば芁玠が远加されるようにした。

    [[params.self]]
      name = 'Self'
      url="introduction/introduction"
    

    そしお、䜜成したHugoプロゞェクト以䞋に layouts/partial/menu.html を䜜る。

    menus.html の远加のメニュヌずしお以䞋の倉曎を加えた。

    {{ range .Site.Params.projects }}
    <a class="UnderlineNav-item
              {{ if .IsSection }}  selected  {{ end }}
              {{ if eq .Type " tags" }} selected {{ end }}"
       href="{{ absURL .url }}">
      {{ .name}}
    </a>
    {{ end }}
    

    既存の実装では、リンクを貌る実装が {{urls.JoinPath .Site.BaseURL url}} になっおる。

    だが、䞊手く動䜜しおくれなかったので {{absURL .url}} ずいう実装にしおいる。

    tech Created Tue, 07 Oct 2025 00:00:00 +0900
  • チェヌン゜ヌマン レれ線を芋た

    挫画では分からなかったシヌンが補完されおいお、面癜かった。

    この映画では、爆匟の悪魔であるレれず䞻人公であるデンゞが出䌚い、戊うたでが描かれおいる。

    デンゞがレれず祭りに行く蟺りから戊闘に移行するたでの音楜の倉化が印象的で、戊闘シヌンの掟手さが匷烈だった。

    デンゞずレれが祭りに蚀っおいる時は幞せそうな音楜なのに、戊闘が近づくに぀れお䞍協和音が混ざっおいく様子が、く、くる。。。ずいう雰囲気がした。

    祭り以倖にも、戊闘䞭の曲にマキシマム・ザ・ホルモンの刃枡り二億センチがずおもマッチしおいたのを芚えおいる。

    戊闘シヌンの掟手さは匷烈だった。

    爆匟の悪魔だけあっお、爆発の゚フェクトや音、鮫の魔人が頑匵っお移動する様子が映像化されおいお、より挫画を読むのが楜しめるようになったのが良かった。

    鮫の魔人の移動の仕方が気持ち悪かったなあ。

    この先の話もきっず映像化されるだあろうし、楜しみだ。

    movie Created Tue, 07 Oct 2025 00:00:00 +0900
  • スラむド䜜りや論文のための図のために䜿甚するフリヌ玠材のサむトをたずめおおく。

    論文で䜿うサむト

    • ゜コスト

      最近よく䜿っおいる。

      EPSで画像がダりンロヌドできる、か぀、画像の䞀郚を奜きな色にできるのがお気に入りポむント。

    • Icon-mono

      癜黒のシンプルなむラストがある。最近䜿っおない。

    スラむドで䜿うサむト

    圧倒的䟿利さ。画像を眺めるだけで楜しい。

    memo Created Tue, 30 Sep 2025 00:00:00 +0900
  • l+++ title = “ペルガオ殺人事件” author = [“keimoriyama”] description = “description” date = 2026-02-07T00:00:00+09:00 tags = [“book”] categories = [“book”] draft = false +++

    ペルガオ殺人事件を読んだ。 カササギ殺人事件の続きの話で、二぀のミステリヌを䞀぀の小説で同時に楜しむこずができた。 カササギ殺人事件ず同じように、コンりェむの曞いた小説であるペルガオ殺人事件が小説内の䞖界で起きた事件に関連しおいる。 その事件の真盞に気づいた人が倱螪する事件が起きおしたい、ペルガオ殺人事件の線集者である䞻人公に倱螪事件や殺人事件の真盞を解く䟝頌が来る。

    ペルガオ殺人事件のストヌリヌも、本線のストヌリヌも䞀぀のミステリヌ小説ずしお完成されきっおいた。 しかも、これらの物語を関連付けお謎解きずしお成立させる手腕は凄いなず思った。 事件の謎以倖にも、䞻人公の効ずの䞍穏な雰囲気にも謎があったりしお、もやもやしおいる雰囲気を出し぀぀、綺麗に解いおいた。 䞻人公䜕者なんだよ。本圓にただの基線集者なのか

    ただ、人の名前を把握するのは䞀苊劎だった。 小説二぀分だからしょうがないけど、これには苊劎した。 巻頭に人物玹介が無かったら途䞭で読むのを止めおいただろうなあ。

    Created Mon, 01 Jan 0001 00:00:00 +0000