ファイル
このページでは,Builcule のファイル入出力に関する機能を紹介します.
自作のファイル入出力以外に,libopenbabel を経由したファイル入出力も実装しています.
さらに,隠しディレクトリに保存される設定ファイルやデータファイルについても紹介します.
目次(ページ内リンク)
自作の機能:対応形式は XYZ 形式,PDB 形式および PDBx/mmCIF 形式,それから,独自形式である BCL 形式です
Open Babel 経由の入出力
FASTA 形式:FASTA 形式はアミノ酸配列を記述する形式です.入力はホモロジーモデリング用,出力は内部で検知したアミノ酸配列です
隠しディレクトリ内のファイル:ホームディレクトリに隠しディレクトリを作成し,その中にバックアップファイルや中間ファイルを格納します
自作の機能
メニューバーの [ファイル(_F)]-[開く(_O)] / [保存(_S)] で呼び出される機能です.
[開く(_O)] の対応形式は XYZ 形式,PDB 形式および PDBx/mmCIF 形式,それから,独自形式である BCL 形式です.
[保存(_S)] の対応形式は XYZ 形式,PDB 形式,および独自形式である BCL 形式です.
なお,ファイルを開く際にダイアログボックスに PDH というフィルタも表示されます.
これは Builcule 独自に名前を付けた,OpenBabel の PDB 形式です.
やや特殊なので,Builcule 開く際には拡張子で区別しています.
XYZ 形式
XYZ 形式で記述したメタンを下に示します.
5 This file was creatwd with Builcule. C -0.00000 0.00000 -0.00000 H 1.07000 0.00000 -0.00000 H -0.35667 0.00000 1.00881 H -0.35667 -0.87365 -0.50440 H -0.35667 0.87365 -0.50440
BCL 形式
BCL 形式は,XYZ 形式に結合情報を追加した独自形式です.
すなわち,原子の通し番号とその原子の結合先の通し番号を記述しています.
BCL 形式で記述したメタンを下に示します.
5 This file was creatwd with Builcule. C -0.00000 0.00000 -0.00000 0 1 2 3 4 H 1.07000 0.00000 -0.00000 1 0 H -0.35667 0.00000 1.00881 2 0 H -0.35667 -0.87365 -0.50440 3 0 H -0.35667 0.87365 -0.50440 4 0
- 1 行めには,原子数が記されています
- 2 行めはコメント行です
- 3 行め以降は,原子ごとの xyz 座標(カルテシアン座標 == ガウス座標)が記されています
- 1 列めは元素記号,2,3,4 列めはそれぞれ,x,y,z 座標です
PDB 形式
PDB 形式はタンパク質の構造を記述する形式の一つです.
下に PDB 形式で記した Gly-Gly の例を示します.
Builcule は,下の例でいうと,右端の元素の列,その左に記している座標を読み取っています.
ATOM 1 N GLY A 1 -2.379 0.509 0.033 N ATOM 2 CA GLY A 1 -1.268 -0.408 -0.202 C ATOM 3 C GLY A 1 0.027 0.289 0.095 C ATOM 4 O GLY A 1 0.148 1.595 0.523 O ATOM 5 N GLY A 2 1.138 -0.628 -0.140 N ATOM 6 CA GLY A 2 2.399 0.051 0.149 C ATOM 7 C GLY A 2 3.541 -0.891 -0.093 C ATOM 8 O GLY A 2 3.294 -2.179 -0.522 O ATOM 9 OXT GLY A 2 4.838 -0.470 0.115 O TER 10 GLY A
PDBx/mmCIF 形式
cif ファイルの構造は,Data Items Describing Atomic Positions に記述されている "ATOM_SITE Data Entry Example" を参考にしています.
読み取るのは原子ごとの情報を記した行です.
それら各行に記述されている内容を,下に引用します.本来横書きである行の内容が,縦書きに列挙されているので注意してください.
すなわち,Builcule では,行が "ATOM" または "HETATM" で始まっている行の,第 3,11,12,13 レコード(それぞれ元素,X,Y,Z座標)を読み取ります.
# loop_ _atom_site.group_PDB 読むかどうかはこのレコードで判断."ATOM" または "HETATM" であれば読む _atom_site.id _atom_site.type_symbol このレコードを読む(元素) _atom_site.label_atom_id _atom_site.label_alt_id _atom_site.label_comp_id _atom_site.label_asym_id _atom_site.label_entity_id _atom_site.label_seq_id _atom_site.pdbx_PDB_ins_code _atom_site.Cartn_x このレコードを読む(X 座標) _atom_site.Cartn_y このレコードを読む(Y 座標) _atom_site.Cartn_z このレコードを読む(Z 座標) 以下略
cif ファイルの具体例で示すと,
ATOM 4387 N NE2 . HIS D 2 146 ? 29.161 -6.385 24.995 1.00 18.72 ? 146 HIS D NE2 1 ATOM 4388 O OXT . HIS D 2 146 ? 31.310 -12.411 23.487 1.00 25.59 ? 146 HIS D OXT 1 HETATM 4389 C C . CYN E 3 . ? 5.231 -14.989 4.427 1.00 16.65 ? 143 CYN A C 1 HETATM 4390 N N . CYN E 3 . ? 6.279 -15.492 4.453 1.00 23.22 ? 143 CYN A N 1
Open Babel 経由の入出力
この機能は,Open Babel ライブラリ練習ノートで学んだ知識を利用しています.
ファイル形式が多いので,それを選択するためのリストを作成しました.
ファイル形式の選択
メニューコマンドを実行すると,画像に示すファイル形式選択用のリストが現れます.
目的とするファイル形式を選択して [OK] ボタンをクリックしてください.
画像では,cif 形式を選択しています.
[OK] ボタンをクリックすると通常のファイル選択ダイアログボックスが表示されます.
OpenBanel で計算する際の PDB 形式について
Builcule では,OpenBabel エネルギー極小化やコンフォメーション探索をする際に,PDB 形式で入出力しています.
この PDB 形式は多少特殊な記述様式となっています.
- 原子の情報には,非タンパク質を示す接頭辞 HETATM が記述されます
- 多重結合は,CONECT 行に同じインデックスが重複して記述されます
通常の pdb 形式と区別するために,Builcule では拡張子を pdh としています.これは本サイトでのみ通用する表現です.
FASTA 形式(アミノ酸配列の情報)の入出力
[ファイル(_F)]-[FASTA 形式でエクスポート] でペプチドの配列を出力できます.
[実験(X)]-[ホモロジーモデリング] で表示されるウィンドウから,FASTA 形式のインポートが可能です.
インポートされた FASTA 形式は,ホモロジーモデリングに使います.
FASTA 形式での出力
一行あたり,70 アミノ酸残基としています.
コメント行には,分子の通し番号と,その分子内でのペプチドの通し番号とを記述しています.
独自記号として下記のものを使用しています.
- C(大文字): システイン
- c(小文字): シスチン
- X : 未同定アミノ酸残基
- p(小文字): ヒドロキシプロリン
下は,ペプチドを 2 個含むユニットを FASTA 形式で出力した例です.
>mol : 0, seq : 0 ScALGYSAGPcMGMTSRYFYxGTSMAcETFQYGGcMGNGNNFVTEKEcLQTcRTV >mol : 1, seq : 0 AcNLPIVRGPcRAFIQLWAFDAVKGKcVLFPYGGcQGNGNKFYSEAEcREYcGV