ریاضیات و ژنوم

تقریباً در نزدیکیهای قرن بیستم (اواخر قرن نوزدهم) خبر چشمگیری اعلام شد:

اتمام طرح اولیه ژنوم انسان. که این مرحلة مهمی از زندگی نوع بشر محسوب می شود که تقریباً 150 سال پیش در اُدیسه هومر و با کشف و پژوهش چشمگیر مندل[1]
(1884-1822) شروع شده بود و شاید به جرأت بتوان گفت بسط طرح اولیه ژنوم انسانی نقطة عطفی در تاریخ تحول علم زیست شناسی بوده است.

قرن بیستم دورة پیشرفت چشمگیر در همه علوم بود. اما می توان گفت که هیچ یک از علوم به اندازة زیست شناسی مولکولی پیشرفت قابل توجهی نداشته اند. زیست شناسی مولکولی یک دیدگاهی از شخصیت انسانی برای فهم پیچیدگیهای زندگی انسان ارائه می کند و اما ریاضیات در طی این دورة متحرک، ثابت کرد که خدمتگزار پیشرفت بوده است و در این راه علوم ریاضی نقش تسریع کننده در فهم ژنوم داشتند و بدین صورت یک رابطه تنگاتنگ و یک همکاری عمیق بین ریاضیات و زیست شناسی شکل گرفت. با اینکه سابقاً زیست شناسی مولکولی یک موضوع جدید و نویی بود ولی هم اکنون یک موضوع کاملی است که در بسیاری از قسمتهای علوم از جمله ژنتیک مولکولی نقش مهمی را ایفا می کند.

همکاری ریاضیات با علوم زیستی و بینش آن نسبت به ژنوم انسانی و گونه های دیگر یک موضوع بسیار جذابی است که در این جا فقط به یک جنبة کوچکی از این فعل و انفعالات پرداخته می شود. در آغاز به تاریخچة کوتاهی از ریاضیات مشمول در ژنتیک می پردازیم و سپس به بینش ریاضی نسبت به مفهوم فاصله پرداخته می شود.

قبل از آن یک چشم اندازی از طرح اولیه بیولوژی مولکولی و ژنتیک در زیر بیان می‌گردد.

ریاضیات و ژنوم : ریاضیات و ژنتیک کلاسیک (روزگاران قدیم)

در زمانهای باستان زیست شناسان از این موضوع آگاهی داشتند که فرزندان گونه هایی از گیاهان و حیوانات شبیه والدینشان هستند. اما سؤالی که در اینجا مطرح می باشد این است که چرا تفسیر به این مطلب به علمی که ما هم اکنون آن را تحت عنوان وراثت می‌شناسیم مدت زمان زیادی طول کشید؟

جواب سؤال اینگونه به نظر می رسد که گونه های حیوانی هیچ الگویی مطابق مدلهای عملی نداشتند تا ما را به این بینش رهنمون کنند. شاید پرش به جلوی مندل به این دلیل بود که او از طریق تحلیل ریاضی داده های مورد آزمایش ، یک ارتباطی بین فتوتیپ نخودهای آزمایشی با مکانیزم ژنتیکی آنها بدست آورد.

مندل از طریق انجام آزمایشات قابل توجه‌اش به این واقعیت دست یافت که هر ویژگی که از والدین به ارث می رسد توسط فاکتورهای غیرقابل تغییری تعیین می شوند که امروزه به این فاکتورها ژنهای مقیم روی کرومزوم اطلاق می شود. جالب است بدانیم مندل در وین ریاضی تحصیل می کرد که با دوپلر[2] (1853-1803) آشنا شد. اگر چه دوپلر را به عنوان فیزیکدان برجسته می شناسیم اما همزمان با تحصیل در فیزیک به آموختن ریاضیات مبادرت ورزید. دوپلر به عقاید نیوتن به دلیل نزدیکی علوم به یکدیگر اهمیت ویژه ای می داد. اگر چه کارهایی که مندل انجام داد در سال 1865 عمومیت یافت و در سال 1866 منتشر شد اما به طور شگفت انگیزی مورد کم توجهی قرار گرفت. اما در سال 1900 با کشف دوباره عقیده مندل توسط هنگ دی رایس[3] (هلندی) کارل کرنس[4] آلمانی و اریک وان[5] استرالیایی گامهای بعدی در شروع تئوری ژنتیک برداشته شد.

کارهایی که اخیراً انجام شده است سعی بر این دارند که بفهمند مندل از میانگین آزمایشاتش چه چیزی بدست آورد در صورتیکه بعضی از داده های آزمایشات او خیلی خوب نبودند تا او بتواند به واسطة آنها نتایج درست و دقیقی به دست آورد. امروزه با سپری شدن زمان می دانیم که یک استثناء برای همة قوانین مندل وجود دارد.

ریاضیات و ژنتیک کلاسیک : (1953-1900)

همکاری قدیمی دیگر ریاضی و ژنتیک در معادلة هاردی ونبرگ[6] رخ می نماید. هاردی (1967-1877) یک ریاضیدان در کمبریج و ویلیام ونبرگ (1937-1862) دکتر در اشتوتگارت بود. آنها کارهایشان را مستقل از هم انجام دادند. داستان از این قرار است که پاننت[7] (1967-1875) یک مسئله ژنتیکی را با هاردی که عضو هیئت علمی دانشگاه کمبریج بود در میان گذاشت (پاننت به خاطر مربع پاننت معروف است مربع پاننت یک نموداری بسیار مفید و کارآمد در فهمیدن نتایج آمیزش موجودات زنده با ژنوتیپ‌های ممکن متفاوت است) پاننت سخنرانی در مورد مسائله وراثت مندل ایراد کرد در این همایش در جمع حضار ژرژ آدنی بیل[8] (1951-1871) بود که ادعا کرد اگر یک allele خاصی غالب باشد فراوانی این allele افزایش می یابد تا به 5/0 برسد. بعد از آن پایدار خواهد شد که با مشاهدات استاندارد مندل که ژنوتیپ ها به نسبت 3 به 1 دیده می‌شوند سازگار است. پاننت دریافت که دلیل او درست نیست از اینرو و مسئله را با هاردی در میان گذاشت. هاردی از قضیة احتمالی ساده ای استفاده کرد و فرض کرد اگر یک ویژگی، تابع A  , a , allele باشد بنابراین به این نتیجه رسید که تعادلی بین ژنوتیپ های aa , Aa , AA بدست خواهد آمد البته تحت این فرضیات که

1- جهش ژنی رخ ندهد . 2- مهاجرت به درون جمعیت صورت نگیرد 3- آمیزش ها تصادفی باشند ، 4- جمعیت به قدری بزرگ باشد که اثر شانس سبب نوسانات تصادفی در فراوانی allele ها نشود 5- انتخاب طبیعی رخ ندهد، یعنی شانس بقا و تولید مثل برای همه افراد آن یکسان باشد.

با این فرضیات می توان نشان داد که فراوانی allele های a , A با زمان تغییر نخواهد کرد. به علاوه اگر q , p به ترتیب نمایش فراوانی a , A باشند که (1 = p+q) بنابراین فراوانی ژنوتیپ های aa , Aa , AA به ترتیب زیر خواهد بود.

q2 , 2pq , p2  ، پس بنابراین فراوانی ژنوتیپ از فراوانی allele پیش بینی می شود. در طول این دوره علاوه بر ریاضیات، آمار نیز همکاری قوی با ژنتیک داشت. سه فرد معروف در این زمینه هالدن[9] (1964-1892) ، فیشر[10] (1962-1890) و
رایت[11] (1988-1889) این سه تن با یکدیگر در قسمتی از ژنتیک همکاری داشتند و اغلب کارهای آنها مربوط به ژنتیک جمعیت بود که با موضوع پیچیدة ژنوتیپ های درگیر با تعداد زیادی
allele در دوره زمانی طولانی و تحت اسلوب های متفاوت آمیزش سر و کار دارد. برای نشان دادن تأثیر ریاضی در این زمینه به کار فیشر نگاه کنید. فیشر پیشقدم استفاده از ساختار ریاضی شد که امروزه ما آن را تحت طراحی بلوک می شناسیم وی توانست گیاهان با ویژگی و بازدة متفاوت را عیب یابی کند در واقع او مسأله اصلاح نژاد در گیاهان را پایه گذاری کرد.

برجستگی مهم دیگر این دوره وجود دیدگاههای موافق دربارة غیرتغییر پذیربودن واحدهای وراثت (ژن، و دیدگاه داروین دربارة انتخاب طبیعی بود.

زمینه دیگر تفحص در این دوره دنبالة ژنتیکی تولد بین جمعیتهای بسته که از جمعیتهای دیگر تفکیک شده بودند بود، که برای این کار تئوری تغییر ژنتیکی و همچنین دنباله‌ای از انواع متفاوت تولد مطالعه شد. بدین ترتیب ریاضیات و آمار یک همکاری مهم با ژنتیک کلاسیک را ادامه دادند که نتیجه آن تولد شاخة جدید از ژنتیک تحت نام ژنتیک مولکولی بود.

ژنتیک مولکولی ( -present 1953)

با توجه به تاریخ کوتاه از تکامل تدریجی ژنتیک مولکولی، تحول ریاضیات پشتیبان در این زمینه و اندازة ژنتیک مولکولی قابل توجه است. بسیاری از روشهای ریاضی ارائه شده تا نشان دهند که DNA ساختار رشته ای از الفبای 6 حرفی دارد و اینکه پروتئین نیز به صورت رشته ای است که حروف آن امینواسید می باشد.

اما مسائلی که توجه ریاضیات را به خود جلب کرده است:

1- پیدا کردن یک زوج دقیق برای رشته داده شده در داخل یک رشته بلند

2- پیدا کردن یک زوج تقریبی برای رشته داده شده در داخل یک رشته بلند

3- پیدا کردن بهترین زوج برای یک رشته در یک لیستی از رشته ها با مراجعه به تعدادی محکهای بهینه سازی

4- پیدا کردن بهترین زوج تقریبی برای یک رشته در یک لیستی از رشته ها با مراجعه به تعدادی محکهای بهینه سازی

5- پیدا کردن بزرگترین رشته مشترک در لیستی از رشته ها

6- بازسازی کردن یک رشته که رشته منبع را به عنوان یک زیررشته دارد با توجه به مجموعه ای از رشته ها و با اطلاعاتی در مورد خصوصیات مشترک این رشته ها

7- پیدا کردن کوچکترین رشته که رشته داده شده را به عنوان زیر رشته دارد البته با در نظر گرفتن مجموعه ای از رشته ها.

8- با در نظر گرفتن مجموعه ای از رشته ها ، پیدا کردن کوچکترین رشته که رشته داده شده یا معکوس از این رشته ها را به عنوان رشته دارد.

9- با در نظر گرفتن زوجی از رشته ها ، پیدا کردن فاصله بین آنها

10- پیدا کردن درختهایی که به ارتباط نمایشی بین اشیاء کمک می کند.

روشهایی برای برداشتن یک امتداد بلند از DNA که ساختارش برای ما ناشناخته است و همچنین جدا کردن آن در یک مکان خاص وجود دارد. پس بنابراین نیاز داریم که تکه‌های حاصل را مرتب کنیم تا بتوانیم DNA منبع را از این تکه ها بازسازی کنیم.

در روش سنتی مرتب سازی، یک امتداد ویژه از DNA که مربوط به بخش شناخته شده از DNA و از کروموزوم خاص است تعیین محل می شود. در روشی که روش تفنگ گفته می شود کل ژن در یک تکه کوچک هست و ساختار همة کروموزم از این تکه کوچک بازسازی می شود.

5- Mathematice and the Genome : Near and Far (string)

یک روش ریاضی که در دست مطالعه است مطالعه روی ژنوم هایی است که مفهوم فاصله برای آنها معنی دار است. فاصله فقط مفهوم دوری یا نزدیکی اشیاء مجزا را مطرح نمی کند بلکه با فاصله می توان مفاهیمی چون شباهت و تفاوت را نیز ارائه کرد. با توجه به مجموعه ای از اشیاء و شهرها، پرندگان، آهنگ ها ، ژنها ، زبانها ، می توانیم یک عددی را به زوجی از این اشیاء اختصاص دهیم بدین وسیله چگونگی فاصله، شباهت و یا نزدیکی آنها را تفسیر نماییم.

ویژگیهایی از این زوجها لازم است تا بتوانیم اعدادی را به آنها نسبت دهیم.

و اما این ویژگیها عبارتند از:

1- فاصله بین دو زوج صفر یا عدد مثبت است.

2- فاصلة بین دو زوج صفر است اگر و فقط اگر دو زوج یکسان باشند.

3- فاصله بین دو زوج A و B با فاصلة بین دو زوج B  و A برابر است.

4- فاصله بین زوجهای A و B به اضافه فاصلة بین دو زوج B و C حداقل به بزرگی فاصله بین زوجهای A و C می باشد.

این چهار ویژگی در واقع مفهوم فاصلة اقلیدسی را برای ما تداعی می کند.

به عنوان مثال با در نظر گرفتن مکان O = (0 , 0) تماشاخانه ، (4 و 3) C مکان راه آهن در شبکه زیر، فاصله O تا C به صورت روبرو خواهد بود:

(3,4) C

(0,4)

(0,3)

(0,2)

(0,1)

(0)

(0,0)         (1,0)          (2,0)           (3,0)            (4,0)           (5,0)

(0,3)

(0,2)

(0,1)

(0)

B

که از قضیة فیثاغورث به دست می آید. این قضیه بیان می کند که در مثلث قائم الزاویه ضلع c مقابل به زاویه قائم به دو ضلع دیگر از مثلث به شکل زیر رابطه دارد:

C2=a2+b2

که برای نقاط داده شده با مختصات (y1,y2) , (x1, x2) فاصله اقلیدسی بین آنها به صورت زیر خواهد بود:

پس در اینجا این نکته حائز اهمیت است که اغلب بیش از یک راه برای تعریف فاصله بین دو شکل یکسان وجود دارد به عنوان مثال برای تعریف فاصله بین دو نقطة شهری به طریق قبل عمل نخواهیم کرد چرا که یک احتمال وجود دارد که مسیر بین تماشاخانه و ایستگاه راه آهن را با تاکسی طی کنیم بدون تردید فاصله o  تا c دیگر 5 نخواهد بود چرا که تاکسی مسیر o تا B را 3 واحد و مسیر B تا c را 4 واحد طی می کند پس در حالت کلی تاکسی فاصلة بین دو نقطه با مختصات (x1 , x2) ، (y1, y2) را به صورت زیر طی می کند.

|(x1-x2)|+|(y1-y2)|

این مسئله نشان می دهد که با تغییر چشم انداز روی اشیاء یکسان به بینش متفاوت و جدیدی نسبت به آنها دست خواهیم یافت.

اما چگونه می توانیم این مطلب را در مورد ژنتیک مولکولی بیان کنیم، دو گونه چقدر مجزا از هم می باشند. دو پروتئین داده شده چقدر مجزا از هم هستند و یا حتی دو ژن چقدر از هم فاصله دارند. هر فردی با این موضوع به خوبی آشنایی دارد که چگونه می توان فاصله بین دو نقطه که مختصاتشان داده شده است را پیدا کرد ولی این سؤال مطرح است که چگونه می توان فاصله بین دو تصویر، دو ژن و یا دو گونه پرنده را پیدا کرد. پاسخ این سؤال توسط ریچارد همینگ[12] که پیشقدم کار روی تصحیح خطای کدها شد، داده شد. همینگ تشخیص داد که به کمک کدگذاری اطلاعات  در ثنایی در حالت کلی با ورودیهایی از یک میدان مغناطیسی ، می توان خطاها را تصحیح کرد اگر اطلاعات را در شکل کلمات کد با طول ثابت و با ویژگی که آنها را در بسیاری از موقعیتها متفاوت می کند نمایش دهیم برای مثال فاصله بین دو رشته ثنایی

0

1

1

0

1

0

0

1

1

1

1

1

0

0

0

1

1

1

1

0

0

1

6 خواهد بود زیرا در رشته ها،‌وقتی یکی از رشته ها را در بالای رشته دیگر به خط می‌کنیم اختلاف آنها در 6 ستون می شود. این تعریف نیز یک فاصله است زیرا از 4 قانون ابتدایی این مبحث تبعیت می کند و به احترام همینگ، فاصلة همینگ نامگذاری شد. هر چند که برای کار در بیولوژی ریاضی نیازمندیم که این مفهوم از فاصله را به رشته‌ها با طولهای متفاوت بسط دهیم.

وقتی جمعیتها مجذوب بیولوژی ریاضی شدند به ریاضی به عنوان یک ابزاری که به واسطة آن انواع جدیدی از مسائلی که با آن سر و کار داشتند را حل کنند گرایش پیدا کردند همچنین آنها از ریاضی برای بسط ابزارهایی که به آنها کمک کرد استفاده کردند که این ابزارها شامل یک خانواده ای از توابع فاصله است که فاصله ویرایشی و یا فاصله Levenschtein نامیده می شود می باشند.

به بیان دقیق این یک تابع فاصله نیست اما یک خانواده وابسته به تابع فاصله برای محاسبه فاصلة بین دو رشته با ترکیبهای مشابه می باشد. این توابع فاصله قادرند خودشان را با موقعیتهای متنوع گسترده ای وفق دهند که این موقعیتها شامل موقعیتهایی هستند که رشته ها با طول متفاوتند و همچنین شامل عملیاتهایی است که رشته ها در موقعیتهای متفاوت از خود بروز می دهند. در اینجا فاصلة ویرایشی را بین دو کلمة agreed , grind بدست می آوریم:

توجه کنید یک رشته طولی مساوی 5 دارد و یک رشته به طول 6 می باشد. ابتدا با نشاندن علامت [-] به یکی یا هر دو رشته ، طول دو رشته را برابر می کنیم که یک روش به این ترتیب خواهد بود که - grind و agreed هم اکنون دو رشته با طول معادل را به خط می کنیم بنابراین داریم:

-

a

g

g

r

r

I

e

N

e

d

d

عملیاتی که به ما اجازه می دهد یک رشته را به رشته دیگر تبدیل کنیم و همچنین علامت [-] را به رشته ها اضافه کنیم به مانند بالا به ترتیب زیر می باشد.

1- درج یا حذف یک کاراکتر در هر یک از رشته ها

2- جانشینی کردن

در مثال بالا دو ستون 2 و 6 با هم مطابقت دارند. ستونهای 1 ، 4 ، 5 با هم تطابق ندارند برای تطابق دو رشته بالا، در رشته بالایی به جای علامت [-] ، کاراکتر a درج می گردد.

در ستون 4 ، به جای i ، کاراکتر c و در ستون 5 به جای n کاراکتر e جانشین می کنیم بنابراین در این مورد فاصله ویرایشی 3 خواهد شد. مسئله زمانی پیچیده خواهد شد که بخواهیم فاصله بین تکه های DNA که قسمتهایی از ژن هستند را محاسبه کنیم، که در این مورد سه تایی بودن حروف نقش مهمی را بازی می کند. از آنجایی که دنباله های پروتئین، DNA ، ژن و بسیاری از اشیاء دیگر می توانند به شکل رشته نمایش داده شوند فاصلة ویرایشی یک ابزار قدرتمندی برای تعیین نزدیکی و شباهت می باشد. به ویژه اینکه فاصله ویرایشی مورد استفاده قرار می گیرد تا نزدیکترین ژن به ژن ممکن را پیدا کنیم پس در حالت کلی هدفمان این است که بهترین تطابق را با مراجعه به محکهای متفاوت بیابیم.

6- Near and Far (trees)

اگر شخصی بخواهد اطلاعاتی را از تاریخچه خانوادگی اش بدست آورد متوسل به درخت خانوادگی خود می شود. دانشمندان برای اینکه بر روی تاریخچه سیر تکاملی و روابط اشیاء با هم مطالعه کنند نمودار درختی رسم می کردند و از دانش ریاضی برای استفاده از آن بهره می جستند.

بدنة دانش ریاضی شامل یک قضیه دوست داشتنی و جذاب از درختهای وابسته به فاصله می باشد.

فرض کنید برای هر زوج از اشیاء این امکان وجود داشته باشد که برای هر زوجی یک فاصله تعریف کنیم. به عنوان مثال این فاصله می تواند اندازه تغییر سیستماتیکی باشد که برای تبدیل یک ژن در یک گونه به ژن وابسته در گونه دیگر لازم است. به طور خیلی خاص فرض کنید که یکی 4 دنباله DNA داشته باشد. a,b,c,d که فاصلة ویرایشی آنها در ماتریس زیر نشان داده شده است.

a

b

c

d

a

0

8

9

6

b

8

0

11

8

c

9

11

0

5

d

6

8

5

0

آیا می توان برگهای درخت را طوری برچسب گذاری کرد به گونه ای که مجموع وزنی  در امتداد خط گذرنده از این برگها (خطوط متصل کننده رئوس) به سیلة درایه هایی در جدول (ماتریس بالا) داده شود. به عنوان مثال خط یکتای بین c,a مجموع وزنی به اندازه 9 دارد. (4+2+3) که این عدد درایة موجود در سطرa  ، ستون c از ماتریس بالا می باشد.

b 5 a 3 2 4 d 1 c


که این نمایش درخت متناظر با ماتریس بالا می باشد. زیرا همة فواصل در ماتریس متناظر با مجموع وزنی روی خطوط می باشند.

قضیه مهمی در این زمینه هست که مشخص می کند که ماتریس فاصله به وسیلة درختی که فقط شامل رئوس یک برگی و سه برگی است نمایش داده می شود و اینکه سطرهای ماتریس فاصله برای برچسب گذاری رئوس، یک برگی مورد استفاده قرار می گیرند. این قضیه بیان می کند که با در نظر گرفتن 4 شیء w,z, y , x یک نمایش از این اشیاء ممکن خواهد بود اگر و فقط اگر فاصله xy به اضافة فاصله zw ، فاصلة xz به اضافه فاصله yw و فاصله xw به اضافه zy متمایز از هم نباشند و دو عدد بزرگتر بدست آمده با هم برابر باشند.

11 9 7 5 a b c d dکه در مثال بالا اعداد بدست آمده 13 و 17 و 17 می باشد که عدد 17 در شرط قضیه بالا صدق می کند. که این شرط معروف به شرط 4 نقطه ای است و این قضیه ای از P.Buneman می باشد. همچنین یک شرط 3 نقطه ای مشابه برای نمایش ماتریس فاصله با در نظر گرفتن یک نوع خاصی از درخت که درخت فرافاصله نامیده می شود وجود دارد که نمودار زیر این نکته را به صورت یک مثال نشان می دهد.

فاصلة بین رئوس توسط یالها نمایش داده می شود که عدد روی کوچکترین رأس داخلی درخت است که در بالای هر یال قرار می گیرد. برای مثال فاصلة بین d, b عدد 9 است.

فاصلة بین همة رئوس در ماتریس زیر نشان داده شده است.

a

b

c

d

E

a

0

5

7

9

11

b

5

0

7

9

11

c

7

7

0

9

11

d

9

9

9

0

11

e

11

11

11

11

0

شرط سه نقطه ای بیان می کند که ماتریس فاصله در این روش به وسیلة یک درخت نمایش داده می شود اگر و فقط اگر برای هر 3 شیء z,y , x فاصلة بین آنها به گونه‌ای باشد که دو عدد بزرگتر با یکدیگر معادل باشند.


ریاضیات و ژنوم :

ریاضیات امکان مدیریت و تحلیل ساختمان فشرده ای از پایگاه داده های پروژه ژنوم انسان را فراهم می کند. تحلیل عددی، آماری و مدلسازی یک نقش عمده در نقشه و ترتیب گذاری طرح اولیه DNA و همچنین اطلاعات ژنتیکی که ساختار هر یک از واحدهای ما را تعیین می کنند دارند.

پژوهشگران پیش بینی کردند که این آمیختگی ریاضیات ، زیست شناسی،‌یک شاخه جدیدی از علم را ایجاد خواهد کرد که آن پزشکی مولکولی خواهد بود. پزشکی مولکولی زمانی موفقیت آمیز خواهد بود که در تشخیص، معالجه و پیشگیری از بیماری منحصر به فرد و ویژه باشد.

اطلاعات روی ژن:

تقریباً در داخل هر سلول در بدن ما، یک مجموعة پیچیده ای از دستورالعملهای ژنتیکی که شامل 23 جفت کروموزوم می باشد وجود دارد. کروموزوم ها زنجیره های بلند مرکب از DNA (ریبونوکلئیک اسید) مولکولهای مارپیچی نخ مانند در داخل سلولهای ما می باشند. هر کروموزوم به هنگام چرخش‌(پیچش) ژنهایی را که شبیه مهره روی یک رشته هستند حمل می کند،‌ژنها (بخش کوچکی از DNA) بسته هایی از دستورالعملها برای ساختن پروتئین های مخصوص می باشند که نحوة عمل سلول را بیان می کنند. دستورالعملهای ارثی در یک کد چهار حرفی نوشته می شوند و هر حرف به یکی از سازنده های شیمیایی DNA (شامل نیتروژن شیمیایی که باز نامیده می شود ) منطبق است.

T (thymine) , C (cytosine) , G (guanine) , A (adenine)

دنباله ای از سازنده های TS , CS , GS , AS دستورالعملی برای یک پروتئین خاص می باشند که پروتئین ها مولکولهای پیچیده مرکب از آمینواسید می باشند. اگر این دستورالعملها در هم شوند یک سلول می تواند یک پروتئین اشتباه را به مقدار خیلی کم یا خیلی زیاد بسازد که نتیجه آن منجر به ایجاد یک بیماری می شود.

دانشمندان تعداد ژنهای انسان را حدود 000/30 تا 000/40 ژن تقریب زده اند که این تعداد فقط 2% از ژنوم انسان را تشکیل می دهند و باقیمانده شامل مناطق بدون کدی است که ساختار بدون نقص (کامل) کروموزوم را تشکیل می دهند و همچنین زمان و مکان و کمیت پروتئین ساخته شده را کنترل می کنند.

همة انسانها هم مجموعة پایه ای یکسانی از ژنها دارند و هم اینکه همه ما در ناحیة تنظیمی ژنها که وظیفه کنترل پیشرفت و حفظ و نگهداری ساختار بیولوژیکی بدن را بر عهده دارند مشابه هستیم.

اما در عین حال یک تفاوتهایی بین ما وجود دارد. بنابراین زنجیره سوابق پروژة ژنوم (HGp) که بر روی یک نمونه ای از یک گروه منحصر به فرد پایه گذاری شده است ریاضی دقیقی از هر یک از ژنهای مشخص ارائه نمی دهد بنابراین هدف مهم HGp ، این است که تعداد زیادی از نواحی کوچک DNA که خیلی منحصر به فرد می باشد را تعیین کند و همچنین زمینه بیماری که هر شخص مستعد به آن است و داروهایی که موجب حساسیت هر فرد می شود را مشخص کند.

نقشه و ترتیب گذاری چیست؟

یک نقشه ژنتیکی شامل هزاران نشانه کوچک است، تکه های مشخص از DNA با فواصل کمتر یا بیشتر در امتداد کروموزوم قرار گرفته اند. این نقشه محققین را قادر می سازد که با دقت به مکان ژن بین هر دو تا نشانه اشاره کنند. نقشة ژنتیکی شامل تکه های روی هم افتاده DNA که در یک کروموزوم قرار گرفته اند می باشد. وقتیکه نقشه فیزیکی کامل می شود، محققین با بکار بردن نقشه ژنتیکی ژن را به یک ناحیه مخصوصی از یک کروموزوم نسبت می دهند. پس بنابراین با انتخاب و مطالعه یک تکه مخصوص از یک نقشه فیزیکی خیلی سریعتر می توان یک ژن را تعیین محل کرد تا اینکه بخواهیم در سرتاسر یک کروموزوم کامل (بی عیب) به دنبال یک ژن باشیم.

ترتیب گذاری :

هدف نهایی از HGp این است که دنباله (زنجیره ) کاملی از همة 3 میلیون باز نوکلوئیتیدی که سازنده های ژنوم انسان می باشند را حرف به حرف رمزگشایی کند. دانشمندان علوم کامپیوتر، بیولوژیستها، فیزیکدانان و مهندسین ، همه تکنولوژی خودکار را به منظور کاهش زمان و هزینه ترتیب گذاری ایجاد کردند و زمانی که دنبالة ژنوم انسان کامل شود توجه ما از کار یافتن ژن به سمت فهمیدن آن جلب خواهد شد.

ریاضیات مشمول در پروژة ژنوم انسان:


آنالیز عددی:

تحلیل عددی DNA میکروسکوپی است اما با این وجود تعداد داده هایی که آن را تولید می کنند بزرگ می باشند پس محققین نیاز دارند به اینکه تکنیکهای عددی را بسط دهند تا بتوانند درکشان را از داده ها تحلیل کنند.

آمار:

علم آمار فقط یک قسمت در تولید پیش نویس دنباله داده ها را نشان می دهد که اساساً قطعه شامل 000/10 جفت بازی که مکان کروموزوم را تقریب می زنند معلوم است و بعلاوه اینکه ترتیب گذاری این ابهامات را کاهش می دهد. همچنین اینکه آمار در طراحی آزمایشاتی برای بهینه سازی اطلاعات منتج شده از این آزمایشات مورد استفاده قرار می گیرد.

مدلهای محاسباتی:

پژوهشگران سعی می کنند تا رفتارهای مولکولی را به کمک توصیف DNA و مولکولهای پروتئینی با معادلاتی که به صورت عددی قابل حل می باشند پیش بینی کنند و اینکه مقدار زیادی از داده های در دسترس ما را قادر می سازند که پیش بینی ها را با نتایج به دست آمده مقایسه کنیم.

توپولوژی :

توپولوژی با شکل و هندسه ساختارهای پیچیده سر و کار دارد. ساختار مارپیچی دوبل پایه‌ای DNA اطلاعات بسیار خوبی در مورد مولکول ها فراهم می کند که البته کامل نمی‌باشند. جزئیات ساختار و شکل های متفاوتی از DNA ، اطلاعاتی دربارة تابع بیولوژیکی DNA در اختیار ما قرار می دهد.

طراحی کامپیوتری :

با طراحی کامپیوتری می توان تصاویر متحرک و ایستایی از ساختار DNA بسازیم به طوریکه این تصاویر علاوه بر محققین ، افراد غیر متخصص را نیز قادر می سازد تا تصور بهتری نسبت به ژن داشته باشند.

طرحهای بلوکی    Block design :

در ریاضیات ترکیبی یک نوع خاصی از مجموعه  دستگاهها است که کاربرد همیشگی در طراحی آزمایشات بر عمده دارد و به علاوه این که دارای جنبه کاملاً ترکیبی می‌باشد.

مجموعه متناهی x ، و اعداد صحیح  داده شده است. تعریف می کنیم 2-design B,  را که یک مجموعه ای از زیر مجموعه های k عضوی از x که بلوک نامیده می شوند به گونه ای که تعداد r تا از بلوکها شامل x در X و مستقل از x  و تعداد  از بلوکها شامل y , x متمایز داده شده در X و همچنین مستقل از این انتخابها باشند. در اینجا  ( تعداد عناصر Xb (تعداد بلوکها ) و r , k و  پارامترهایی از طرح هستند. (همچنین B می تواند شامل همة زیر مجموعة k عضوی x نباشد که در این صورت B کامل نخواهد بود). طرح به صورت زیر نشان داده خواهد شد.

design - و یا –design  که همة پارامترها مستقل از هم نیستند،  و  و  را تعیین می کنند و اینکه همة پارامترها ترکیبی از  نیستند.

به عنوان مثال قرار گرفتن خط ها در صفحة تصویر متناهی (که x مجموعة نقاطی از صفحه و  می باشد ) و دستگاه سه تایی اشتاینر (k=3) (steiner) برای هر عدد صحیح  داده شده یک B , t-design ،‌یک کلاسی از زیر مجموعه های –k عضوی از X می باشد که بلوک نامیده می شود به طوریکه تعداد r تا از این بلوکها شامل هر x در X و مستقل از x می باشند و همچنین تعداد  تا از بلوکها شامل هر مجموعة t عضوی T و مستقل از انتخاب T می باشند. عدد  (تعداد عناصر X) ، b ، (تعداد بلوکها)  پارامترهای طرح می باشند. طرح به صورت زیر نمایش داده می شود.

 و این 4 عدد ، r, b را تعیین می کنند و نمی توانند به صورت دلخواه تعیین شوند. مثالی در این مورد شامل یک زیر فضای d بعدی از هندسه تصویر متناهی می‌باشد (که t=d+1 و ).



[1] - Gregor Johann Mendel

[2] - Johann Doppler

[3] - Hungo de Vries

[4] - Carl Correns

[5] - Erich von Tschermak

[6] - G.H Hardy - Weinberg

[7] - R.C. Punnett

[8] - George Udney Yule

[9] - J.B.S. Haldane

[10] - R.H. Fisher

[11] - Sewell Wright

[12] - Richard Hamming

نظرات 0 + ارسال نظر
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)
ایمیل شما بعد از ثبت نمایش داده نخواهد شد