ファイル

このページでは,Builcule のファイル入出力に関する機能を紹介します.
自作のファイル入出力以外に,libopenbabel を経由したファイル入出力も実装しています.
さらに,隠しディレクトリに保存される設定ファイルやデータファイルについても紹介します.

目次(ページ内リンク)


自作の機能:対応形式は XYZ 形式,PDB 形式および PDBx/mmCIF 形式,それから,独自形式である BCL 形式です
Open Babel 経由の入出力
FASTA 形式:FASTA 形式はアミノ酸配列を記述する形式です.入力はホモロジーモデリング用,出力は内部で検知したアミノ酸配列です
隠しディレクトリ内のファイル:ホームディレクトリに隠しディレクトリを作成し,その中にバックアップファイルや中間ファイルを格納します

自作の機能

メニューバーの [ファイル(_F)]-[開く(_O)] / [保存(_S)] で呼び出される機能です.
[開く(_O)] の対応形式は XYZ 形式,PDB 形式および PDBx/mmCIF 形式,それから,独自形式である BCL 形式です.
[保存(_S)] の対応形式は XYZ 形式,PDB 形式,および独自形式である BCL 形式です.

なお,ファイルを開く際にダイアログボックスに PDH というフィルタも表示されます.
これは Builcule 独自に名前を付けた,OpenBabel の PDB 形式です.
やや特殊なので,Builcule 開く際には拡張子で区別しています.

XYZ 形式

XYZ 形式で記述したメタンを下に示します.

5
This file was creatwd with Builcule.
C         -0.00000        0.00000       -0.00000
H          1.07000        0.00000       -0.00000
H         -0.35667        0.00000        1.00881
H         -0.35667       -0.87365       -0.50440
H         -0.35667        0.87365       -0.50440

BCL 形式

BCL 形式は,XYZ 形式に結合情報を追加した独自形式です.
すなわち,原子の通し番号とその原子の結合先の通し番号を記述しています.
BCL 形式で記述したメタンを下に示します.

5
This file was creatwd with Builcule.
C         -0.00000        0.00000       -0.00000         0         1         2         3         4
H          1.07000        0.00000       -0.00000         1         0
H         -0.35667        0.00000        1.00881         2         0
H         -0.35667       -0.87365       -0.50440         3         0
H         -0.35667        0.87365       -0.50440         4         0

PDB 形式

PDB 形式はタンパク質の構造を記述する形式の一つです.
下に PDB 形式で記した Gly-Gly の例を示します.
Builcule は,下の例でいうと,右端の元素の列,その左に記している座標を読み取っています.

ATOM      1  N   GLY A   1      -2.379   0.509   0.033                       N
ATOM      2  CA  GLY A   1      -1.268  -0.408  -0.202                       C
ATOM      3  C   GLY A   1       0.027   0.289   0.095                       C
ATOM      4  O   GLY A   1       0.148   1.595   0.523                       O
ATOM      5  N   GLY A   2       1.138  -0.628  -0.140                       N
ATOM      6  CA  GLY A   2       2.399   0.051   0.149                       C
ATOM      7  C   GLY A   2       3.541  -0.891  -0.093                       C
ATOM      8  O   GLY A   2       3.294  -2.179  -0.522                       O
ATOM      9  OXT GLY A   2       4.838  -0.470   0.115                       O
TER      10      GLY A

PDBx/mmCIF 形式

cif ファイルの構造は,Data Items Describing Atomic Positions に記述されている "ATOM_SITE Data Entry Example" を参考にしています.

読み取るのは原子ごとの情報を記した行です.
それら各行に記述されている内容を,下に引用します.本来横書きである行の内容が,縦書きに列挙されているので注意してください.
すなわち,Builcule では,行が "ATOM" または "HETATM" で始まっている行の,第 3,11,12,13 レコード(それぞれ元素,X,Y,Z座標)を読み取ります.

#
loop_
_atom_site.group_PDB 読むかどうかはこのレコードで判断."ATOM" または "HETATM" であれば読む
_atom_site.id
_atom_site.type_symbol  このレコードを読む(元素)
_atom_site.label_atom_id
_atom_site.label_alt_id
_atom_site.label_comp_id
_atom_site.label_asym_id
_atom_site.label_entity_id
_atom_site.label_seq_id
_atom_site.pdbx_PDB_ins_code
_atom_site.Cartn_x  このレコードを読む(X 座標)
_atom_site.Cartn_y  このレコードを読む(Y 座標)
_atom_site.Cartn_z  このレコードを読む(Z 座標)
以下略

cif ファイルの具体例で示すと,

ATOM   4387 N  NE2 . HIS D 2 146 ? 29.161  -6.385  24.995  1.00 18.72 ? 146  HIS D NE2 1 
ATOM   4388 O  OXT . HIS D 2 146 ? 31.310  -12.411 23.487  1.00 25.59 ? 146  HIS D OXT 1 
HETATM 4389 C  C   . CYN E 3 .   ? 5.231   -14.989 4.427   1.00 16.65 ? 143  CYN A C   1 
HETATM 4390 N  N   . CYN E 3 .   ? 6.279   -15.492 4.453   1.00 23.22 ? 143  CYN A N   1 

Open Babel 経由の入出力

この機能は,Open Babel ライブラリ練習ノートで学んだ知識を利用しています.
ファイル形式が多いので,それを選択するためのリストを作成しました.

ファイル形式の選択

ファイル形式選択用のリスト

メニューコマンドを実行すると,画像に示すファイル形式選択用のリストが現れます.
目的とするファイル形式を選択して [OK] ボタンをクリックしてください.
画像では,cif 形式を選択しています.

[OK] ボタンをクリックすると通常のファイル選択ダイアログボックスが表示されます.

OpenBanel で計算する際の PDB 形式について

Builcule では,OpenBabel エネルギー極小化やコンフォメーション探索をする際に,PDB 形式で入出力しています.
この PDB 形式は多少特殊な記述様式となっています.

通常の pdb 形式と区別するために,Builcule では拡張子を pdh としています.これは本サイトでのみ通用する表現です.


FASTA 形式(アミノ酸配列の情報)の入出力

[ファイル(_F)]-[FASTA 形式でエクスポート] でペプチドの配列を出力できます.
[実験(X)]-[ホモロジーモデリング] で表示されるウィンドウから,FASTA 形式のインポートが可能です.
インポートされた FASTA 形式は,ホモロジーモデリングに使います.

FASTA 形式での出力

一行あたり,70 アミノ酸残基としています.
コメント行には,分子の通し番号と,その分子内でのペプチドの通し番号とを記述しています.
独自記号として下記のものを使用しています.

下は,ペプチドを 2 個含むユニットを FASTA 形式で出力した例です.

>mol : 0, seq : 0
ScALGYSAGPcMGMTSRYFYxGTSMAcETFQYGGcMGNGNNFVTEKEcLQTcRTV
>mol : 1, seq : 0
AcNLPIVRGPcRAFIQLWAFDAVKGKcVLFPYGGcQGNGNKFYSEAEcREYcGV

隠しディレクトリ内のファイル

Builcule10 は,ホームディレクイトリに $HOME/.builcule/b10 という隠しディレクトリを作成し,その中に設定ファイルや一時ファイルを格納します.
.builcule 内に作成するファイルを列挙します.