مقدمه ای بر کمومتریکس

برای درک مکانیسم فرآیندهای مختلف شیمیایی، کشف و توسعه مواد جدید، حفظ محیط زیست و زمینه های دیگر شیمی، هنوز توانایی حل مسائل به طور کامل وجودندارد و برای عملی کردن بعضی از مسائل، نیاز به سیستم های بسیار پیچیده ای می باشد که انجام آنها در گرو صرف هزینه های بسیار و مطالعات گسترده است.

درجهت حل این مشکل، روشهای محاسباتی کمومتریکس می توانند مفید باشند. تجزیه و تحلیل آماری و ریاضی داده های شیمیایی معمولاً تحت عنوان کمومتریکس یاد می شود. به عبارتی دیگر کمومتریکس یک روش کارآمد برای خلاصه کردن اطلاعات مفید از یک سری داده مشخص و پیش بینی سری دیگر داده هاست.

درحقیقت هدف کمومتریکس، بهبود بخشیدن فرآیندهای اندازه گیری و استخراج اطلاعات شیمیایی مفیدتر از داده های اندازه گیری شده فیزیکی و شیمیایی می باشد.

کمومتریکس اولین بار توسط دانشمنـد سوئـدی به نام ولـد در ســال 1972  به کـار گــرفته شد و توسط کووالسکی توسعه داده شد و درسال 1974  انجمن بین المللی کمومتریکس تأسیس گردید. درسال 1974 در ایتالیا ، دو تیم فورینا  و کلمنتی  شروع به فعالیت در این زمینه کردند و از سال 1980 دانش کمومتریکس خیلی سریع توسعه یافت.

چندیــن تعریف بــرای  کمومتــریکس بیــان شده است کـه غالبــاً درمتــن های تجزیــه ای  بــه کارمی روند. یکی از جامع ترین تعاریف به صورت زیراست:

کمومتریکس شاخه ای از شیمی است که از ریاضی و آمار و منطق استفاده می کند برای اینکه:

      الف ) فرآیندهای تجربی بهینه را طراحی و انتخاب کند.

      ب ) حداکثر اطلاعات شیمیایی قابل حصول را از تحلیل اطلاعات شیمیایی فراهم کند.

      ج ) بتوان اطلاعات بیشتری درمورد سیستم های شیمیایی بدست آورد.


کمومتریکس به عنوان یک شاخه علمی جوان در دو دهه اخیر به سرعت توسعه پیدا کرده است. این رشد سریع مدیون پیشرفت سریع دستگاههای هوشمند و خودکار آزمایشگاهی و همچنین امکان استفاده از کامپیوترهای قدرتمند و نرم افزارهای ساده است. بنابراین کمومتریکس به عنوان یک وسیله در همه قسمتهای شیمی و بیشتر در زمینه شیمی تجزیه مورد استفاده قرارگرفته است. امروزه یک شیمی دان تجزیه به صورت فزاینده ای به استفاده از روشهای آماری و ریاضی درکارهای روزمره اش نیاز پیدا می کند .

کمومتریکس درشاخه های مختلف شیمی مورد استفاده قرارمی گیـرد که بـرخی از این کاربردها شامل کنترل فرآیندها، تجزیه و تحلیل و شناخت الگوها، پردازش علائم و بهینه کردن شرایط می باشد .  یکی از زمینه های مهم کاربرد کمومتریکس در مطالعاتی است که خواص مولکولها را به ویژگی های ساختاری آنها نسبت می دهد.

ازنظر شیمی دانان فعالیت و خواص یک ترکیب ناشی از ویژگی های ساختاری آن است. این نوع از مطالعات به بررسی کمی ارتباط ساختمان با فعالیت، QSAR ، و همچنین بررسی کمی ارتباط ساختمان با ویژگی، QSPR، معروف می‌باشد.

هدف از مطالعات QSAR پیداکردن رابطه ای است که بین رفتار فیزیکوشیمیایی یک مولکول با  پارامترهای ساختاری آن وجود دارد .

نتایج این مطالعات علاوه بر شفاف سازی نحوه ارتباط بین خواص مولکول ها و ویژگی های ساختمانی آنها به پژوهشگران در پیش بینی رفتار مولکول های جدید براساس رفتار مولکول های مشابـه کمک می کند.

به مجموعـه ابــزارها و روشهایـی که به این منظـور مـورد استفـاده قرار می گیرند روش های پارامتری  گویند. در روش های پارامتری سعی می شود بین یک سری توصیف کننده های مولکولی با فعالیت یا خاصیت مورد نظر ارتباط منطقی برقرار شود. توصیف کننده های مولکولی که به این منظور استفاده می شوند، مقادیر عددی می باشند که جنبه های مختلف ساختاری مولکول را به طور کمی نشان می دهند.

مقاله های فراوانی درمورد استفاده از روش های پارامتری در مطالعات QSAR تاکنون منتشر شده اند، که برخی از آنها عبارتند از:

- پیش بینی سمیت بعضی از داروهای آمیدی و آمینی توسط خیاط زاده ماهانی و همکارانش .

- پیش بینی ضرایب فعالیت ترقیق نامحدود بعضی از ترکیبات آلی در آب توسط یی لین کائو و همکارانش .

- پیش بینی شاخص گزینش پذیری یک سری ازترکیبات پنتا کلروفنل تثبیت شده برروی پلیمر توسط نانتاسنامات و همکارانش .

-  پیش بینـی اندیـس بازداری یک سری از ترکیبات بنزن در کروماتوگرافی گازی توسـط  گرکانی نژاد و همکارانش . - مدل سازی تحرک الکتروفورتیکی، زمان بازداری و فاکتور پاسخ نسبی ترکیبات مختلف توسط گرکانی نژاد و همکارانش .

- پیش بینی ضرایـب فعالیت ترکیبــات در پارافین های با وزن مولکولی کم توسط اندراس و اروین .

- مدل سازی فشار بخار تعداد بسیار زیادی از ترکیبات توسط لیانگ.


امروزه در کمومتریکس از روشهای مختلف ریاضی و آماری مانند رگرسیون خطی چندگانه، MLR ، حداقل مربعات جزئی، PLS  آنالیز اجزاء اصلی، PCA  استفاده شده است. همچنین در پیشرفتهای دو دهه اخیر از شبکه های عصبی مصنوعی، منطق فازی و الگوریتم ژنتیکی نیز استفاده شده است.

این روشها جزء دسته ای از علوم کامپیوتر به نام هوش مصنوعی، AI ، قـرار می گیرند که تفاوت اساسی با سایر روشهای محاسباتی و همچنین با یکدیگر دارند. در سیستم های  ریاضی متداول، دانسته ها به صورت قواعد روشن و از پیش مشخص شده ای در سیستـم وجود دارد، در حالی که این سیستم ها قواعد را توسط آموزش از مثال هایی که به آنها داده می شوند فرا می گیرند. از میان روش های فوق استفاده از شبکه های عصبی مصنوعی در شیمی نقش برجسته ای پیدا کرده و کاربرد آن در شیمی به سرعت درحال افزایش است.

از میان شاخه های مختلف شیمی، شیمی تجزیه یکی از شاخه هایی است که بیشترین استفاده را از شبکه های عصبی مصنوعی کرده است.

جلالی هروی و همکارانش استفاده از ANN  را در شبیه سازی و جستجوی طیف های جرمی گزارش کرده اند .

پیش بینی میزان جابجایی شیمیایی C13NMR ، شناسایی الگوها از داده های کروماتوگرافی،

پیش بینی ضریب پاسخ آشکارسازهای شعله– یونشی و هدایت گرمایی و

پیش بینی ضرایب انتخابگری الکترودهای یون گزین از دیگر موارد گزارش شده از کاربردهای ANN است.

با استفاده از شبکه های عصبی مصنوعی می توان خواص و فعالیت مولکول ها را پیش بینی کرد یا اینکه از آن در آنالیز مخلوط های پیچیده استفاده نمود، نوع ترکیب و زیر گروه های آن را از روی طیف آن شناسایی کرد و توالی پروتئین ها را در DNA مشخص نمود.

از شبکه های عصبی مصنوعی به خوبی می توان در شناخت الگوها و طبقه بندی داده ها استفاده کرد. همچنین از این شبکه ها در مطالعات QSAR، هنگامی که ارتباط بین توصیف کننده ها و کمیت مورد مدل سازی پیچیده و غیرخطی بوده و یا اینکه پردازش سریع حجم وسیعی از اطلاعات مورد نیاز باشد می توان به خوبی استفاده کرد.

مدل سازی بازداری کروماتوگرافی یونی،

آنالیز کمی داده های چند متغیره و

مدل سازی سطح پاسخ در کروماتوگرافی مایع با کارآیی بالا نیز از دیگر کاربردهای شبکه های عصبی مصنوعی می باشد.

پیش بینی آنتالپی آلکان ها،

پیش بینی ثابت دی الکتریک،

پیش بینی تحرک الکتروفورتیک سولفونامیدها در الکتروفورز موئینه

و پیش بینی جداسازی ترکیبات کایرال توسط جولین–ارتیز  و همکاران

از جمله مقالات منتشر شده راجع به استفاده از شبکه های عصبی مصنوعی در مطالعات QSAR می باشد.

یکی از مهم ترین ویژگی های شبکه عصبی مصنوعی در این است که شبکه های فوق، سیستمی برنامه ریزی شده با قواعد از پیش تعیین شده نمی باشند و می توانند طی فرآیندی که آموزش نامیده می شود ساختار درونی خود را به صورت تجربی به نحوی تنظیم کنند که بهترین پاسخ ممکن را برای داده های ورودی ایجاد کند. استفاده از شبکه های عصبی مصنوعی به جای روش رگرسیون خطی چندتایی در مطالعات QSAR، به خصوص هنگامی که ارتباط بین توصیف کننـده  و فعالیـت مورد نظـر خطـی نبوده و یا اینکه بین آنها بر هم کنش هایی وجود داشتـه باشد باعث بهبـود مدل حاصلـه خواهــد شــد .