muninがssh経由で動かない

まだ新しいさくらのVPSへの移行が終わっていない。今回はChef Soloで全部セットアップしてやろうとしていたがサーバ監視で使っているmuninが動かない。

Chefでセットアップして、とりあえずVagrant環境をmuninマスターにして新しいさくらのVPSで動かしたmuninノードを監視しようとしてみた。しかしデータが全く取れない。 [FATAL] Socket read from xxx failed.というようなエラーが出ている。

設定としては以下のようにssh経由で接続しようとしてるけど動かない。

[host.example.com]
  address ssh://host.example.com/bin/nc 127.0.0.1 4949
  use_node_name yes

ノード側の auth.log を見るとマスターからのmuninユーザでのsshの接続は成功している、10秒くらい接続してユーザ側(マスター側)から切断されている。

次にノード側の munin-node.log を見ると何も残っていない。つまり、sshまでは接続できているがそこからNetcat経由でmunin-nodeに届いていない感じ。

しかし、マスターからmuninユーザで、

ssh host.example.com /bin/nc 127.0.0.1 4949

と打つとmunin-nodeにつながるし、fetch cpuと打てばデータは取れる。でもmuninのプログラムからは失敗する。

回答がないが以下の人と同じ状況だ。

Setup munin-node with native ssh
http://nerdanswer.com/answer.php?q=13482

そもそも現行サーバの設定を比べようかと思ったら、現行サーバでも取得できていない!!!年間グラフをみると昨年12月くらいからデータがとれなくなっている。

muninのバージョンは2.0.6。少し古く何かバグがあるかもしれないのでwheezy-backportsを使って2.0.19まで上げてみようかと思っている。

そして現行サーバのmunin-nodeで使っているプラグイン見てたらpostfixもセットアップする必要があることに気がついた。またChefのレシピを書かないといけない。もうGWだというのに。