تبلیغات
بیوانفورماتیك,bioinformatics,بیوانفورماتیک - دورنمای بیوانفورماتیك
بیوانفورماتیك,bioinformatics,بیوانفورماتیک
تنها پایگاه آموزش بیوانفورماتیک به زبان فارسی,www.ibp.ir,این ویلاگ زیر مجموعه پرتال بیوانفورماتیک ایرانیان میباشد به آدرس
شنبه 30 تیر 1386

دورنمای بیوانفورماتیك

شنبه 30 تیر 1386

پدیدار شدن دورنمای سیستم نرم افزاری بیو انفورماتیک


ائتلاف رشته
کامپیوتر و زیست شناسی تخصصی، نرم افزار بیوانفورماتیک یک وسیله قدرتمند برای سازمان دادن و استخراج مقدار زیادی از اطلاعات ژنتیكی فراهم می کند . زیست شناسی به سرعت به یک علم مرتبط با داده ها تبدیل می شود . امر حتمی، توان عملیاتی بالا در استفاده از تکنولوژی برای تحقیق پدیده های زیستی است که یک فاکتور مهم در این جریان به حساب می آید. مثلا آخرین اجرا از انسان ، برنج ، گیا هان شكوفه دار ) Arabidopsis thaliana ) تصویر ژنها حکایت از مرحله مهمی در جمع آوری داده ها دارد. توسعه محصولات جدید فناوری از الگوریتم های جدید و مجموعه برنامه هایی که به کاربر اجازه ایجاد، تغییر و مدیریت و استفاده از پایگاه داده می دهد و افزایش تلاش ها و تولید مقدار زیادی از داده ها و تلاش محققین می تواند بسیار مهم باشد . پتانسیل برای دانشمندان برای استنباط کردن دانش بیولوژیكی محاسباتی از یک دسک-تاپ جذاب و واقعی است . در این بحث ما چشم انداز های مقالات و گزارش ها را برای نشان دادن غیر قابل اجتناب بودن و اهمیت نرم افزار بیوانفورماتیک را مانند یک انتظام در حق مالكیت آن جمع آوری کرده ایم .
زیست
شناسی مولكولی برای دانشمندان پس زمینه های وابسته به اطلاعات فراهم می کند .
موضوعات
سیستم نرم افزاری بیو انفورماتیک :
محققان
و دانشمندان کامپیوتر متقابلا سیستم نرم افزاری مفید بیوانفورماتیک را خلق می کنند، با چند ین موضوع و مباحث تکرار شونده ما هفت موضوع را مشخص می کنیم:
1-
ماهیت اطلاعات و داده های زیستی

2-
ذخیره سازی اطلاعات ،تجزیه و تحلیل و بازیابی

3-
محاسبه،مدلسازی و شبیه سازی

4-
بیولوژی با معنی اطلاعات و یکپارچگی انها

5-
کندوکاو در داده ها

6-
مجسم کردن پردازش و تجسم فکری ان

7-
خاتمه این چرخه

انجام هر یک
از این موارد خصوصیات و چگونگی برخورد با یک یا چند موضوع دیگر را پوشش میدهد.


با کلیک بر روی ادامه مطلب
تمام بخشهای را که در بالا نام برده شده است را میتوانید مطالعه کنید..........


ماهیت داده های زیستی
حیات دانش های ادبیات و هنر رهاورد نتایج زیست شناختی مبتنی بر جمع اوری دقیق،تجزیه و تحلیل و بررسی داده هایی است که پژوهشگران با اطمینان زیاد از انهاا ستفاده می کننداگر چه هر روزه بیو_ انفورماتیک رسیدگی میکند به داده های خام و ناقص جمع اوری شده از تحقیقات کامل اخیر به فرم تصویر،نمودار،اعداد و همچنین مرتب کردن داده های جمع اوری شده با تنوع زیادازdatabaseموجود در شبکه.ما باید توجه داشته باشیم به چنین داده هایی با مقداری شک و بد بینی هر مجموعه مهم و معنا دار از ازمایشهای اولیه روی داده ها شامل خطاهای تجربی، اصولی و یا تصادفی برا به دست اوردن داده های اماری با معنا احتیاج دارد به طرح های ازمایشی دقیق و تعدد نتایج.ازمایش ها در شرایط حرفه ای کار،واکنش گرها،تجهیزات و زمان پر خرج هستند.به عنوان یک نتیجه داده های زیستی همیشه نا تمام هستند.
زیست شناسی مولكولی برای دانشمندان کامپیوتر
هر اندام موجود زنده میتواند به طور صحیح به یک یا سه قلمرو باکتری،Archaea- Eucarya -Eulcaryote طبقه بندی میشود.یک بخش از حوزه eucarya یک عضو یک یا چند سلولی است.هر سلول از هر کدام یک غشای نیمه تراوا دارد و پوسته داخلی مرز اجزای تشكیل دهنده می باشد که organelles نامیده میشود.هسته مرکزی یکی از organelles ها تشکیل شده است از اطلاعات ژنتیک اندام های اولیه و مکانیزم پاسخ گویی ژنتیکی.گیاهان و جانوران eulcaryote هستند.در مقایسه هر عضو متعلق به حوزه باکتری یا archaea یک prokaryote است.یک عضو تک سلولی با یک غشای نیمه نفوذ ناپذیر که شامل هیچ organelles داخلی نیست.به خصوص یک prokaryote هیچ هسته ای ندارد.اولین prokaryotic سلولها
در زمین 3.5بیلیون سال پیش ظاهر شد.باکتری و archaea جداگانه نمو کرد ند از یک جد مشترک تقریبا 3 بیلیون سال پیش.eucarya نمو کرد ند از archaea تقریبا 1.8بیلیون سال پیش.
ژنها و کپی برداری
کروموزوم ها-مولکول های بزرگ متشكل از دو جفت استاندارد درزوکسی ریبو نوکلئیک اسید (DNA) و پروتئین 3،2در بردارند اطلاعات ژنتیكی یک عضو را. اطلاعات روی یک DNA مولكولی تفسیر میکند فرمی از یک کد طولی از چهار مبنا:A برای ادنین (نوعی باز پور ین به فرمولC5H5N5،C برای سیتوزین،A برای گانین وT برای تیمونی.د و تا از زمینه های تکمیلی شكل ضعیف نیروهای بین مولكولی که هر کدام مقید به دیگری است می باشد.Aکامل میکند T را وقتی C کامل میکند G را در یک کروموزوم ، دو DNA کناری هر کدام اطلاعات یكسان حمل می کتند . اما یک گوشه دار منشا تکمیل پایه های کناری است . در دستورالعمل این کدها یک بار معکوس و بار دیگر کامل می شود . کد ATGGCAACC به GGTTGCCAT تبدیل می شود و اتصال شیمیایی می تواند بصورت زیر نمایش داده شود:

DNA

C - C - A - A - C - G - G - T - A
| | | | | | | | |
T - A - C - C - G - T - T - G - G

DNA کناری متمایل هستند از انتهای 5-به انتهای 3. همچنین کد روی دو رشته کناری خوانده می شود ATGGCAACC وGGTTGCCAT ژن یک عضو شامل DNA سالم که محتوی کروموزوم های هر سلول است و این کروموزوم ها شامل ژن عضو است هر کدام زیر دنباله منحصر به فردی هستند از کد خطی . هر ژن شامل زنجیره های منظم و فرمول قابل خواندن است . ORF یک زنجیره است داخل ژنی که در یک فرآیند نسخه برداری نامیده می شود. و به عبارت دیگر کپی ORF روی کد کناری DNA در مولكول های RNA ، mRNA نامیده می شود . ریبو نوکلئید اسید (RNA) یک مولكولی شبیه DNA است که در بر دارنده یک کد خطی چهار بنیادی A ،C ، G، U. U برای uracil ، U جایگزین T میشود به عنوان اساس تکمیل A. نسخه برداری اتفاق می افتد وقتی مولكول mRNAتولید می شود از DNA های کناری بدون کد به عنوان مثال:

mRNA

C - C - A - A - C - G - G - U - A
| | | | | | | | |
G - G - T - T - G - C - C - A - T

مولكول mRNA به این دلیل حمل میکند یک کپی کامل از کد کناری .فرایند بردن کپی ها ممکن است به هم متصل کند تعدادی زیر دنباله از مولكول mRNA که نامیده میشوندintrons:.eucaryote,archaea ها اینترونز دارند اما باکتریها ندارند.
مرکز تولید پروتئین
یک مولكول mRNAش میکند بیرون نوکلئون های داخل کتیزول.جایی که کد مولكولها تعیین میكنند چگو نه پروتئین ها ساخته میشوند.زنجیره مولکولی mRNA رمز گشائی میشود تا معلوم شود یک زنجیره از بیست امینو اسید به فرم ساختاری پروتئین اولیه است. یک زنجیره سه پایه ای کشیده میشود از A,C,G,U کدهای مخفی برای یک امینو اسید بر طبق کدهای ژنتیكی است.
برای آگاهی از این پیشرفت ما باید استدلال قیاسی که استوار بر اطلاعات زیستی موجود است را با نتایج تجربی جدید بیامیزیم .بر استی بعضی اطلاعات زیستی بطور ذاتی غیر قابل ادراک هستند . مانند ژنهایی که بیشتر نوع آنها از بین رفته است . توسعه دهندگان سیستم نرم افزاری بیو انفور ماتیک باید آگاه باشند که در هر پیامدی از سیستم خلق کردن تعداد نامعلومی وجود دارند . بدین گونه توصیف و کمیت چیز نامعلومی را تعیین کردن ارزش رسیدگی را دارد.
ذخیره سازی اطلاعات ، تجزیه و تحلیل و بازیابی :
حجم بالای داده های رانده شده از آزمایشهای مدرن زیستی منجر شد به ایجاد DB زیادی که شامل ژن ها ، پروتئین زنجیری و داده های ژنتیک و دیگر نوع داده ها بود شد . محققان اغلب کلید می کردند باز یابی های اطلاعات خود را از بعضی DB اصلی روی یک خصوصیات ، از قبیل نوکلئید یا زنجیره آمینواسید ، ترکیب موجود زنده ، ژنهای حاشیه ای یا نام پروتئین . پاسخ دادن به تحقیقات، اغلب بعضی فرم های تجزیه و تحلیل از قبیل مفاهیم آماری ، دسته بندی یا جستجوی ترتیبی و همانند سازی را در گیر می کرد. اساسی ترین ابزار دسته بندی موضوعی تحقیقات است در زمینه بیو انفورماتیک . یک زیست شناس از این ابزار استفاده کرده و هنگام آزمایش یک DNA جدید یا زنجیره پروتئین ها را ( blast) با همه زنجیره های DB برای یافتن بیشترین شباهت بین زنجیره ها مقایسه می کرد.
مدل سازی کامپیوتر و شبیه سازی
در افزایش تولید داده های تجربی شبیه سازی کامپیوتر نقش مرکزی را در فهمیدن فرایند های زیستی بازی می کند . مثلا محققان می توانند مطالعه کتند فرایند هایی از قبیل تقسیم سلول با مدل سازی و انعکاس شبکه به عنوان یک مجموعه معادله دیفرانسیل . آنها می توانند از ابزار اعداد و محاسبات عملی برای نشان دادن موضوعاتی چون " این انزیم تقسیم سلول ها را در جه سرعتی کاتالیز می کند." در مارس 2002 یک نشریه علمی پیشرفت های مهمی در سیستم زیست شناختی که مبتنی بر شبیه سازی بودند را نمایش داد.
مثلا َAUG کد گذاری می کند برای آمینو اسید متینین M ، GCA برای آلانین A و ACC برای ترونینT بنابراین قطعات کوچک mRNA ،AUGGCAACCکد می گذارد برای زنجیره آمینو اسیدی MAT فرایند های انتقال یافته از 1 کد ژنی مولکول mRNA برای ساختن یک زنجیره پروتئینی استفاده می کنند . پروتئین ها مولکول هایی ضروری برای ساختن سلول ها هستند. یک پروتئین ممکن است یک آنزیم باشد که کاتالیز می کند یک فعل و انفعال شیمیایی را .اجزای یک سلول بنیادی به عنوان یک مبدل به طبیعت پاسخ می دهند و یا به عنوان عناصری قدرتمند و نظم دهنده مانع تعدادی از فرایند های داخل سلول از قبیل سوخت و ساز ، نسخه برداری و نقل و انتقال ، قرار دادن پروتئین ها در یک شكل هندسی سه بعدی و خواص شیمیایی ، ساختار پروتئین ها را تعیین می کند . در یک سلول همه ژن ها در هر زمان داده شده فعال نیستند ،به خصوص نسخه برداری عوامل _مولکول هایی که بطور تفاضلی محصور می شوند در زنجیره های منظم ژنی . کنترل و تنظیم کردن یک نسخه از ژن . ژن هایی که در mRNA نسخه برداری می شوند باید واضح و صریح باشند . داخل یک سلول صدها یا هزاران ژن ممکن است اظهار داده شوند . در اصل در تعیین کردن چگونگی اینکه یک ژن بطور معمول بیان می شود ودر چه حد و اندازه محققان می توانند تعداد مولکول های mRNA با کد زنجیره ای یکسان به عنوان ژنی که در هر زمان داده شده وجود دارد را اندازه بگیرند.
رشد و نمو تکنولوژی
استنتاج سریع محاسبه تکنولوژی فراورده های اطلاعات اساسی بیولوژیكی را رشد داد. ابتدا ترتیب گذاری می تواند تعیین کند سلسله مراتب پایه ها را در مولکول DNA که طول آن از اندکی از صد تا اندکی از هزار پایه گذاری شده اند . محققان می توانند قطع کنند یک مولکول DNA بزرگ را از قبیل یک کروموزوم در میان هم پوشانی قطعات متلاشی شده از اندازه ای که بتوان آن را اداره کرد اداره کرد . زنجیره تمام قطعات و باز سازی مولکول های اصلی از طریق محاسبه کامپیوتری . ترتیب دهی و همبستگی محاسبات اکنون آن قدر پیشرفته هستند که ما می توانیم باز سازی کنیم یک ژن کوچک چند میلیون پایه ای بلند را در چند ین روز محدود.Micro arrays ها فراهم می کنند یک متد برای شناخت حالت بسیاری یا همه زوج ژنهای یک عضو در برابر کردن در هر زمان معین.اکنون زیست شناسان میتوانند بدست او رند یک تصویر لحظه ای یا یک طرح حالت ژن مطابق واکنش اعضا که فقط زنجیره اطلاعاتی ایستا و بدون حرکت فراهم میکند.ازمایشهای Micro array تولید میکند طرحی از حالت ژن که فراهم میکند اطلاعات پو یا و دینامیک در مورد ساختار سلولها این اطلاعات برای رسیدگی و تحقیق فعل و انفعالات پیچیده درون سلولها لازم است از میان دگرگونی هایی در ژنتیک نوع جدید اعضا نمو داده میشود.اگر ما توجه کنیم به اولین گونه انسانی در زمین به عنوان ریشه در یک درخت دودویی ، همه گونه هایی که بطور جاری وجود دارند همواره یک فرم تکاملی یا تکاملی نژادی داشتند . به خاطر دو گونه در مجاورت نزدیک روی درخت تکاملی پویا که ژن هایی داشت که نزدیک بودند در زنجیره . محققان می توانند و به راستی باید مطالعه کنند DNA و زنجیره پروتئین را برای باز سازی و رابطه فیزیولوژیکی میان گونه ها .
مراجع:


1. C.R. Woese, O. Kandler, and M.L. Wheelis, “Towards a Natural
System of Organisms: Proposal for the Domains Archaea, Bacteria,
And Eucarya,” Proc. Nat’l Academy of Sciences USA, Nat’l Academy
Of Sciences, Washington, D.C., vol. 87, no. 12, 1990, pp. 4576-4579.
2. B. Alberts et al., Essential Cell Biology, Garland, New York, 1998.
3. G.M. Cooper, The Cell: A Molecular Approach, 2nd ed., ASM Press,
Washington, DC, 2000.
4. G. Gibson and S.V. Muse, A Primer of Genome Science, Sinauer,
Sunderland, Mass., 2002.
5. L.S. Heath et al., “Studying the Functional Genomics of Stress
Responses in Management System,” Comparative and Functional Genomics,
Vol. 3, no. 3, June 2002, pp. 226-243.

Loblolly Pine with the Expresso Micro array Experiment