まだ新しいさくらのVPSへの移行が終わっていない。今回はChef Soloで全部セットアップしてやろうとしていたがサーバ監視で使っているmuninが動かない。
Chefでセットアップして、とりあえずVagrant環境をmuninマスターにして新しいさくらのVPSで動かしたmuninノードを監視しようとしてみた。しかしデータが全く取れない。 [FATAL] Socket read from xxx failed.
というようなエラーが出ている。
設定としては以下のようにssh経由で接続しようとしてるけど動かない。
[host.example.com]
address ssh://host.example.com/bin/nc 127.0.0.1 4949
use_node_name yes
ノード側の auth.log
を見るとマスターからのmuninユーザでのsshの接続は成功している、10秒くらい接続してユーザ側(マスター側)から切断されている。
次にノード側の munin-node.log
を見ると何も残っていない。つまり、sshまでは接続できているがそこからNetcat経由でmunin-nodeに届いていない感じ。
しかし、マスターからmuninユーザで、
ssh host.example.com /bin/nc 127.0.0.1 4949
と打つとmunin-nodeにつながるし、fetch cpu
と打てばデータは取れる。でもmuninのプログラムからは失敗する。
回答がないが以下の人と同じ状況だ。
Setup munin-node with native ssh
http://nerdanswer.com/answer.php?q=13482
そもそも現行サーバの設定を比べようかと思ったら、現行サーバでも取得できていない!!!年間グラフをみると昨年12月くらいからデータがとれなくなっている。
muninのバージョンは2.0.6。少し古く何かバグがあるかもしれないのでwheezy-backportsを使って2.0.19まで上げてみようかと思っている。
そして現行サーバのmunin-nodeで使っているプラグイン見てたらpostfixもセットアップする必要があることに気がついた。またChefのレシピを書かないといけない。もうGWだというのに。