1999 新旧 orbit (center ドメインのサーバ) 入れ換え記録 9/2、やっと新しいマシンが届く。木曜日である。しかし授業などで忙しい、 週末は学会発表もある。マシンをいじるからには集中して触りたいので、今日 は立ち上げて root で入ってみるだけにする。 週も開けて 9/6 である。以下のような設定を行っていく。さすがに1日で行っ たわけではないが、大体このような順だったと思う。root のパスワードの設 定、ホスト名とネットワーク。NFS server、client としての設定。ユーザ登 録として臨時ユーザを作成。グループファイルもさわる。NIS server、ftp server の設定をして、mail server すなわち sendmail.cf を作る。そろそろ ユーザ登録をする。しかしまだホームディレクトリは無い。pop server の設 定をし、いずれこのマシンに移すつもりなので web server も立ち上げておく。 ログファイルなどでルートパーティションが溢れないように処理するよう設定、 /tmp に対しても対処しておく。混沌としていた従来のメールエイリアスを整 理して登録、プリンタも使えるようにする。スレーブとして DNS server を動 かしてみた。ユーザのホームを自動でテープにバックアップするためのスクリ プトを作成、登録しておく。 入れ換え後の後日談となるが、termcap になかった kterm も登録し、 app-defaults で、kterm のデフォルトを euc に変更する。これを書いている 時点での残りの作業としては、web ドキュメントの移動、DNS 上の CNAME の 変更を予定している。samba や cap も立ち上げたいと思っているが、実行す るだろうか。inn も入れてはあるが、需要も少ない昨今、これはいらないであ ろう。ここまでは単体での設定である。以下が実際の入れ換え、予想外のクラ イアントの設定となる。クライアントの設定変更は学生に任せようと思ってい たのだが、そうも言ってられなくなったのである。 前日 9/22 のうちに、余分なクライアントを落しておく。予定通り 9/23 の祝 日、人のいないこの日に center ドメインのサーバである orbit の入れ換え を決行。朝 10 時くらいに出勤、入れ換え時の手順をもう一度考える。予定の 12 時。old-orbit の sendmail を停止、キューが残っていないかの確認。 第一のトラブル。予想外にキューが溜っている、10 弱くらいだっただろうか。 orbit を通過するメールは1分一通程度なので、偶然のタイミングではない。 記録を見てみる。前日に止めたクライアント宛のメールである。メールアドレ スにマシン名を入れて来るものの多くは「広告メール」なので、配送が送れたっ て構わないだろう。と思ったら、自分であえて forward しているユーザもい た。しかし、今からクライアントを動かして配送してもどうせ読めないので、 手早く入れ換えて old-orbit を一クライアントとして動かしてしまおう。 一部のファイルサーバも兼ねていた old-orbit と、その他のファイルサーバ となっていた2台、new-orbit の4台で LAN を組む、外とはつながない。 12:30 くらいから各ユーザのホームディレクトリのコピーを始める。マシン (のパーティション) 毎に作成しておいたスクリプトを走らせ、それを静観す る。old-orbit からは 0.5GB 程度、30 分程で終った。先日、実験も兼ねて 0.4GB 程度を動かした時は2時間程かかったのを思うと、やはり余分なクライ アントを止めて、外界から隔離したのも影響しているのだろうか。 次に3つのパーティションにユーザホームを持つマシンからコピーを試みる。 が、できない。正常にマウントできていない。原因が分からない。とりあえず、 web サーバも行っているマシンの方からコピーを始める。原因が分かった。最 近多発している rpc プロセスのエラーである。当該プロセスの再起動で正常 にマウントできた。トラブル、と言う程でもないか。このマシンからのコピー は後回しである。web サーバの方からのコピーは 1.5GB 程度である。2時間 もあれば終るだろうと推測していたが、そうはいかなかった。4時間程度要し ただろうか。おかげで別の原稿書きの仕事がはかどりましたさ。終りがけに福 井君が顔を出してくれた。しかし、ただひたすらコピー中なので、声援だけ頂 く。 最後のマシンからのコピーである。3つのパーティション合わせて 1.5GB 程 度。と思ったが、自分の分と、その他少々を前夜までにコピーしてしまったの で、実際は 1GB 強。1時間強で終っただろうか。時刻にして6時半。止める 時間を 12:00 - 18:00 とアナウンスしてあったが、コピーに (実は) 予定通 り6時間かかったわけである。もっとかかったら大変だと危惧していたが、こ れならあまり遅くならないうちに帰れるだろう。 安心して、一端4台の電源を落す (実は web サーバは既に落してあった)。 new-orbit の新たな位置を決めて電源を入れ、臨時に行ってあった設定の変更 を行い再起動する。orbit としてどうさしているのを確認をして、ネットワー ク、すなわち外部に接続する。19:00 である、早速下位ドメイン宛のメールが やって来る、無事リレーされているのを確認して一安心。orbit 入れ換え、に ついては無事完了。正確には後述する一点を除いて、であるが。 他のマシンのコンセントも抜いてしまい、配線、配置をゆっくりと好きなよう に行う。この間、1時間くらいだろうか、先日掃除も兼ねて部屋を整理してお いたから、個人的趣味に走る。ドメイン内のクライアントの接続を確認するた めに、web サーバを立ち上げる。root で login する。NIS は引けている。大 丈夫だ。ユーザホームのファイルサーバとなる new-orbit に対するマウント の設定 (オートマウント) を行い、一般ユーザとして login を試みる。でき ない。NIS は引けている。マウントの設定をよく見て気付くべきだった。 old-orbit; SunOS4 の /usr/local をごっそりとマウントしていた。おかげで tcsh が見つからないわけだ。まいった、SunOS 系のマシンは全て依存してや がる。入れ換えが失敗となった時の予備として数日は old-orbit をそのまま 寝かせておくつもりだったが、前述のメールキューの件もあるため、今日中に 動かすつもりだったので、後でクライアントとしての設定に変えよう。そして、 old-orbit からマウントすることにしよう。これも、トラブルと言う程のこと でもないか。 時刻は 20:00 頃だろうか。諸田君がたまたま web にアクセスしてしまい、作 業は終ったのか、と顔を出す。old-orbit が /usr/local のサーバとなってい た話を聞き、隣の部屋の別の OS、FreeBSD マシンを立ち上げる。new-orbit 上のホームディスクを手動マウントする。一般ユーザとして login できるこ とを確認する。が、ここでトラブル発覚。read はできるが、write ができな い。マウントオプションなど、マニュアルをあさる。new-orbit の OS との相 性が悪いのだろうか。Net 上の web もあさってみる。彼も探してみてくれた が、これといったものが見つからない。平行して同じく隣の部屋の Linux マ シンを彼が立ち上げる。手動マウント、login。リモートファイルシステムに 書き込める。OKだ。 一端、FreeBSD のマシン達はおあずけとし、SunOS 系のマシンに取り掛かって いた。他の SunOS4 のマシンからオートマウントで new-orbit のマウントを 設定する。しかし、new-orbit からのマウントだけができない。web サーバか らのマウントはできるのである。また、相性が悪いのだろうか。しかし手動で のマウントは可能であり、書き込みもできるだろう。一般ユーザでログインし て確認したいが、ログインシェルが無いためテストできない。多分できるだろ うと思い、ログインシェルを変更してのテストは行わず、/usr/local の復帰 を考える。22:00、電車も無くなる時刻、努力だけ頂いて、帰途につく彼を見 送る。 old-orbit の rename、クライアントとして動かすわけである。NIS のサーバ としてのデータを消す。その他、色々と変更。ここで一つミスをおかした。と りあえず reboot をして、状況を確認しようと、host 名を変えなかったわけ である。orbit が2台である、IP address だって同じである。もちろん、ネッ トワーク的には離してあるので衝突は起こらない。ただ、だからこそ NIS サー バが見つからない。そして、一番運が悪かったのは、old-orbit のモニタがい かれていたことである。実は、状況が何も確認できない。NIS 云々というのは、 この時点では推測である。設定の変更は、別の HUB でノートパソコンと orld-orbit 2台で LAN を組んでtelnet していたのである。そして、ping は 通るが telnet を受け付けない。目が点になった…。 NIS がらみか否か、単に boot に失敗したのか…。ディスクアクセスしていな いのを確認し、強制的に電源を落して再起動。telnet を試みるも、不可能。 new-orbit の名前、IP address を一端、設定時の臨時のものに戻して、 old-orbit をつないでみる。reboot も行う。しかし、telnet 不可能。後から 考えると、なぜこれでうまくいかなかったのかは分からないが、焦っていたせ いもあるのだろう。23:30 頃だろうか、友人から電話が入る。あぁ、泣き事を 言いたい気分、しかし声援だけ頂いておく。とうに日付も変わっている。シリ アルケーブルを持って来て、接続を試みるも、これも不可能。コネクタの形状 の都合から、2本のケーブルをつないで挑戦したわけだが、両方ストレートだ と思う。どちらにしても、システム自体が反応していなかったようだが…。 1:00 くらいだったと思う、黒岩君がたまたまやって来て顔を出す。お言葉に 甘えて夜食の買い出しに行ってもらった。12 時間以上前に食べてからお茶し か飲んでいなかった、感謝。 この頃になると、前後関係がすっかり適当である。もう踊り出したい気分さね。 2:00 くらいだろうか、いかれて映らないため外してよけてあった old-orbit のモニタを移動してつないでみる。コネクタが特殊なため、つながるモニタは これしか無い。わずかな望みをかける。コントラストをいっぱいに上げる。ブ ラウン管は発光している、しかし見事に画面が乱れている。水平方向にずれて、 なんだか左右反転したような文字も見える。パズルでも見る気分で解読。NIS のサーバがいないと文句を言っている。やはり。いや、何とか読めなくもない ぞ。ハードウエア割り込みをかけ、シングルユーザモードで立ち上げる。頭の 中身を左右反転させ、ホスト名を何とか変更する。他は大丈夫なはずなので reboot。ネットワークにつなぐ。NIS サーバ、new-orbit が何とかしてくれる はずだ。telnet、よし、login プロンプトがでた、入れるぞ、うんうん。 web サーバからオートマウントする。よし、一般ユーザでログインできるぞ。 しかし他の SunOS マシン、やはり new-orbit からのオートマウントができな い。ひとまず fstab に直接書き込んで良とする。これで SunOS 系のマシンと Linux は大丈夫である。あれこれ確認しているうちに4時が近付いて来る。 FreeBSD は明日 (というのか…) にして、帰って寝てしまおうか。一端、自室 の鍵も締めて階段を降りかけるも、そういう時に物事はひらめく。FreeBSD で NFS mount のマニュアルを読む。英語なので流し読み、いや、気になる単語だ け拾っていく。NFS のバージョン2でのマウントオプションを見つける。マウ ント。リモートファイルシステムへの書き込みに成功する。原因はともかく、 現状としては良とする。 5時くらいだろう、今から帰っても逆につらいだろう。何で、かは一応伏せて おくが、喉を潤しながら色々と確認する。うんうん、大丈夫だ。完璧とは言い がたいが、ユーザ達に迷惑にならない所までこぎつけたぞ。6時、外は既に暗 くはない、半分はあらかじめ用意しておいたお知らせのメールを書き加え、ユー ザ宛に送る。ここで最後のささやかなトラブルが発覚した。 メールアドレスにマシン名を付けてある場合は、下位ドメインもあるため、各 マシンにリレーするように設定してある。ところが、orbit 宛のメールのとき にもリレーを試みてループしてしまっている。灯台もと暗しである。色々テス トはしたが、これには気付かなかった。設定を修正し、配送の確認をして仮眠 する。お休みなさい。 さて、9/25 土曜日の夕方である。old-orbit のモニタであるが、実は立ち上 げに成功してから2時間くらい後であろうか、十分文字が読めるくらいになっ ていた。時おり画面が乱れるが、緊急のときにくらいなら使えるだろう、と思っ た。いや、緊急であれば、何時間も待っていられないだろうか。マシンとして も御老体である。old-orbit 上にある他の SunOS 系マシンが共有していたも のを、ディスクに余裕のあるマシンについてはローカルにコピーしておく。 web サーバには比較的余裕がある。必要そうなものは全てコピーする。ローカ ルに余裕の無いマシンについては、一部、あるいは全部を web サーバからマ ウントすることに変更した。また、new-orbit のファイルシステムに対しては、 どうせ new-orbit がいなければ NIS サーバもいないわけである、fstab マウ ントで構わないだろう。web サーバ他については、オートマウントとする。 これで当面は大丈夫であろう。 こうして、2000 年を控えた center ドメインのサーバ、新旧 orbit の入れ換 えは、ひとまず終ったわけである。あとはちらほらと出て来るであろう設定の 抜けに対応していくだけである。いや、それがまた大変かもしれないが。