lori.academicdirect.orglori.academicdirect.org/research/grants/ID1051/PCE_ID_1051_Extenso_2008.pdf ·...

106
PCE ID-1051 De la Chimia Matematică la Chimia Cuantică şi Chimia Medicală - lucrare în extenso - 2008

Transcript of lori.academicdirect.orglori.academicdirect.org/research/grants/ID1051/PCE_ID_1051_Extenso_2008.pdf ·...

PCE ID-1051

De la Chimia Matematică la Chimia Cuantică şi Chimia Medicală

- lucrare în extenso -

2008

Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese,

workshop-uri) şi dobândirea de competenţe complementare (stagii de

documentare/cercetare în străinătate) Activitatea "Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese,

workshop-uri) şi dobândirea de competenţe complementare (stagii de documentare/cercetare în

străinătate)" este o activitate de tip perfecţionare/documentare prin participarea la stagii scurte în

acest sens în străinătare şi are ca scop dezvoltarea resurselor umane. A fost prevăzută în cadrul celor

3 obiective ale anului 2008, drept activitate 3 (aferentă obiectiv 1), activitate 5 (aferentă obiectiv 2)

şi activitate 9 (aferentă obiectiv 3). Stagiile în străinătate au avut ca subiect participarea la cursuri,

şcoli de vară, simpozioane şi conferinţe internaţionale, acestea fiind detaliate în continuare.

Obiectiv 1. Activitate 3.

÷ Introduction to Practical Statistics for Medical Research

÷ Organizator: University College London (UCL), Londra, UK

÷ Tip: curs

÷ Perioadă: 6-11 Aprilie 2008;

÷ Deplasare: aferentă Obiectiv 1, Activitate 3;

÷ Participanţi: Lorentz JÄNTSCHI;

÷ Tematica cursului:

Basics of Study Design Rumana OMAR UCL Introduction to Data Analysis Caroline DORE MRC Observational Studies in Health Research Rumana OMAR UCL Randomised Controlled Trials Doug ALTMAN UOx Estimation and Hypothesis Testing Gareth AMBLER UCL Comparing Groups of Continuous Data Caroline DORE MRC Analysis of Categotical Data Pauline ROGERS UCL Sample Size Calculations Caroline DORE MRC Correlation and Linear Regression Gareth AMBLER UCL Further Regression Topics Gareth AMBLER UCL Measures of Disease in Health Research Rumana OMAR UCL Logistic Regression Andrew COPAS UCL Analysis of Survival Data Andrew COPAS UCL Analysis of Clustered Data Rebeca TURNER MRC Statistics in Medical Journals Doug ALTMAN UOx Legendă: UCL - University College London, Londra, UK MRC - Medical Research Center, Londra, UK UOx - University of Oxford, Oxford, UK

÷ Puncte cheie din tematica cursului:

o Basics of Study Design

Designul este cel mai important aspect al unui studiu;

Trebuie să răspundă întrebării de cercetare;

Designul studiului acoperă:

• Studii observaţionale;

• Trialuri controlate randomizate;

Este esenţială pregătirea protocolului de cercetare;

Aspecte metodologice:

• Specificarea obiectivului cercetării trebuie să includă:

o Estimarea frecvenţei de apariţie a fenomenului observat;

o Generarea şi testarea ipotezelor;

o Înţelegerea cauzelor fenomenului observat;

o Evaluarea intervenţiei sugerate de cercetare;

• Specificarea populaţiei incluse în studiu:

o Asigurarea reprezentativităţii eşantionului;

o Criteriile de includere şi excludere din studiu;

o Specificarea răspunsului primar urmărit;

o Specificarea răspunsurilor secundare urmărite;

o Asigurarea unui eşantion de control;

o Influenţa dimensiunii eşantionului asupra semnificaţiei;

• Estimarea influenţelor:

o Evaluarea confuziilor între factorul urmărit şi alţi factori;

o Eroarea produsă de selecţie;

o Eroarea produsă de observabilă;

o Eroarea produsă de observator;

o Eroarea produsă de evenimente anterioare celui urmărit;

• Manipularea datelor:

o Responsabilitate;

o Evidenţe duble;

o Construcţie unei baze de date;

o Menţinerea confidenţialităţii;

o Planul de analiză statistică;

o Introduction to Data Analysis

Metode statistice utilizate pentru înţelegerea şi explicarea variaţiilor;

Alegerea metodei de analiză în funcţie de:

• Tipul datelor;

• Structura studiului;

• Presupunerile cu privire la distribuţia datelor;

Tipuri de date grupate pe categorii:

• Două categorii (date binare);

• Categorii nominale (neordonate);

• Categorii ordinale (ordonate);

Variabile răspuns şi variabile expunere;

Date lipsă;

Descrierea datelor;

Măsuri:

• De sumar:

o Valoare tipică;

o Împrăştierea valorilor;

• Valori tipice:

o Media;

o Mediana;

o Centila şi cuartila;

• Împrăştierea valorilor:

o Deviaţia standard;

o Domeniu şi domeniu interquartilic;

Verificarea datelor;

Distribuţii statistice:

• Presupuneri;

• Independenţă;

• Legi de distribuţie:

o Distribuţia normală;

o Distribuţia binomială;

o Distribuţia uniformă;

o Distribuţia log-normală;

o Distribuţia Poisson;

o Distribuţia χ2;

o Distribuţia Student;

Metode parametrice;

Metode neparametrice;

o Observational Studies in Health Research

Studii observaţionale:

• Serii caz-raport;

• Secţionare încrucişată;

• Cohorte;

• Caz-control;

Puterea şi limitele fiecărui tip de studiu;

Tipuri de studii:

• Studii descriptive;

• Studii analitice;

Aplicaţiile designului de studiu;

Stabilirea cauzalităţii în studii observaţionale analitice:

• Criteriul Bradford Hill

o Randomised Controlled Trials

Ce este un trial controlat randomizat;

Aspecte cheie ale designului şi analizei unui trial controlat;

Întâmplarea;

Simularea întâmplării;

Generarea de secvenţe întâmplătoare;

Designul;

Generarea întâmplătoare pe blocuri;

Generarea întâmplătoare stratificată;

Când generarea întâmplătoare apare;

Când generarea întâmplătoare operează corespunzător;

Când generarea întâmplătoare operează necorespunzător;

Alocarea sistematică;

Conducerea (execuţia) unui trial;

Orbirea: asigurarea întâmplării prin privarea de informaţii;

Designul trialurilor clinice;

Trialuri de echivalenţă;

Volumul eşantionului;

Măsuri ale răspunsului;

Protocolul de cercetare;

Probleme de etică;

Probleme cheie ale analizei unui trial controlat;

o Estimation and Hypothesis Testing

Populaţii şi eşantioane;

Analiza statistică;

Estimarea parametrilor populaţiei;

Incertitudinea în estimare;

Distribuţia de eşantionare;

Măsuri ale incertitudinii;

Intervale de încredere;

Testarea ipotezelor în populaţii şi eşantioane;

Valori de probabilitate;

Semnificativ vs. nesemnificativ (statistic);

Interpretarea valorilor de probabilitate;

Estimare vs. testarea ipotezelor;

o Comparing Groups of Continuous Data

Structura datelor;

Presupuneri cu privire la distribuţia datelor;

Eşantioane pereche;

Distribuţia t (Student);

Eşantioane independente;

Distribuţia reziduurilor;

Transformarea logaritmică;

Analiza de varianţă ANOVA;

Distribuţia F (Fisher);

Comparaţii multiple;

Procedura Bonferoni;

o Analysis of Cathegorical Data

Analiza a două grupuri de date grupate pe categorii;

Compararea riscului în două grupuri independente;

Tabele de frecvenţă 2X2;

Testul χ2;

Mai mult de două categorii;

Tabele de frecvenţă mari;

Testul Fisher exact;

Două grupuri pereche;

Testul McNemar;

o Sample size calculations

Importanţa calculului volumului eşantionului;

Calcule bazate pe putere vs. calcule bazate pe precizie;

Metode de bază pentru medii şi pentru proporţii;

Raportarea calculelor de volum de eşantion;

Fezabilitatea studiilor;

Erori de tipul I;

Erori de tipul II;

Nivel de semnificaţie;

o Further Regression Topics

Regresia multiplă;

Predictori binari şi predictori pe categorii;

Interacţiuni;

Selecţia modelelor;

o Measures of Disease in Health Research

Determinarea factorilor ce contribuie la un răspuns medical;

Identificarea şi explicarea amprentelor geografice;

Determinarea, descrierea şi raportarea unui răspuns medical în curs;

Determinarea măsurilor preventive;

Sănătatea în planificarea şi dezvoltarea serviciilor de sănătate;

Furnizarea de date administrative şi de planificare;

o Logistic regression

Când şi unde se foloseşte regresia logistică;

Ce este regresia logistică;

Interpretare: rata parităţilor;

Rata parităţilor vs. riscul relativ;

o Analysis of Survival Data

Ce sunt datele de supravieţuire;

Tabele de viaţă şi curbe de supravieţuire;

Testarea pentru diferite rate de supravieţuire între grupuri;

Analiza de regresie;

Greşeli comune;

o Analysis of clustered data

Când sunt datele grupate;

Metode statistice vs. date grupate;

Metode complexe de investigare;

o Statistics in medical journals

Utilizarea designului şi analizei;

Utilizarea tehnicilor de analiză;

Interpretarea rezultatelor;

Raportarea selectivă a rezultatelor;

Citarea selectivă a literaturii;

Obţinerea concluziilor;

÷ Summer School on Neural Networks in Classification, Regression and Data Mining

÷ Organizator: Institutos Superiores de Engenharia do Porto (ISEP), Porto, PT

÷ Tip: şcoală de vară

÷ Perioadă: 6-12 Iulie 2008;

÷ Deplasare: aferentă Obiectiv 1, Activitate 3;

÷ Participanţi: Lorentz JÄNTSCHI;

÷ Tematica cursului:

Basic Notions. Why NN? Joaquim Marques de Sá MLP and RBF algorithms Petia Georgieva MLP’s with Entropic Criteria Jorge Santos Data Mining with MLPs Paulo Cortez Functional Networks Noelia Sánchez Maroño Multi-class SVMs, Theory Yann Guermeur Functional Networks application Noelia Sánchez Maroño SVMs application to protein secondary structure prediction Yann Guermeur Multiple kernel learning and HM-SVM for bioinformatic applications Alexander Zien Semi-Supervised Learning Alexander Zien Multi-Valued and UB Neurons - I Igor Aizenberg Kernel PLS Mark Embrechts Multi-Valued and UB Neurons - II Igor Aizenberg Selecting Algorithms and Parameters with Meta-Learning Carlos Soares Text Mining Mark Embrechts

÷ Puncte cheie din tematica cursului:

o Basic Notions. Why NN?

Learning Approaches

What are NNs?

A Simple Neuron: The Linear Discriminant

Neural Activation Functions

Learning Dichotomies: The Perceptron

Neural Net Types

FFNN as Universal Approximators

o MLP and RBF algorithms

Historical perspective - biological analogy

Learning algorithms: Backpropagation, conjugate gradient, Newton’s

methods

NN Architectures - MLP, RBF

Examples and applications

o MLP’s with Entropic Criteria

Entropy

Entropy Estimation

Entropy in Learning Systems

Entropic Cost Function

Algorithm Optimizations

Other Similar Algorithms

Experiments

o Data Mining with MLPs

Intensive Care and Meat Quality applications

Knowledge Discovery in Databases (KDD)

Data Mining (DM)

Business Intelligence and Data Mining

DM Methodologies: CRISP-DM

DM goals & DM methods

• Classification

• Regression

• Clustering

• Link analysis

Multilayer Perceptrons (MLPs)

Activation functions

Architecture/Topology

Why Data Mining with MLPs?

• Popularity

• Universal Approximators

• Nonlinearity

• Robustness

• Explanatory Knowledge

Software

R statistical environment

Supervised Learning

Handling Missing Data

Outliers

Non numerical variable remapping

Feature Selection

Classification Metrics

Receiver Operating Characteristic (ROC)

Regression Metrics

Validation method: how to estimate the performance?

MLP Training Algorithm

Local Minima with MLP

Overfitting

Case Study: Intensive Care Medicine (Classification)

Knowledge extraction (Decision Tree example for the renal organ)

Case Study: Lamb Meat Quality (Regression)

o Functional Networks

Introduction to functional networks

Differences between functional and artificial neural networks

Functional equations

Working with functional networks

Different models

Applications

o Multi-class SVMs, Theory

Yann Guermeur

Guaranteed risk for large margin multi-category classifiers

• Theoretical framework

• Basic uniform convergence result

• γ-ψ-dimensions

• Generalized Sauer-Shelah lemma

• Nature and rate of convergence

Multi-class SVM

• Multi-cathegory classification with binary SVMs

• Class of functions implemented by the M-SVMs

• Generalized formulation of the training algorithm

• Three main models of M-SVMs

• Some variants of the main models

• Margins and support vectors

Guaranteed risk for multi-class SVMs

• Bounds on the covering numbers

• Use of the Rademacher complexity

Model selection for multi-class SVMs

• Algorithms fitting the entire regularization path

• Bounds on the leave-one-aut cross-validation error

Open problems

o SVMs application to protein secondary structure prediction

Protein secondary structure prediction

• Different levels of structural organization in proteins

• A problem of central importance in structural biology

• Different measures of prediction accuracy

State of the art

• Choice of the predictors

• Building blocks and architecture of the main prediction methods

Implementation of multi-class SVMs

• Models implemented

• Training algorithm

• Dedicated RBF kernel

• Computation opf weighting vector θ

• Experimental results

Future work

o Multiple kernel learning and HM-SVM for bioinformatic applications

Support Vector Machines (SVMs)

Handling Non-Linearity with Kernels

SVMs as Perceptrons

Application: Predicting Protein Subcellular Localization

Multiple Kernel Learning (MKL)

Large Margin MKL Model

Optimization for MKL

Normalization of Kernels

Multiclass Multiple Kernel Learning

Application: Predicting Protein Subcellular Localization

o Semi-Supervised Learning

Why Semi-Supervised Learning?

Why and How Does SSL Work?

Generative Models

The Semi-Supervised SVM (S3VM)

Graph-Based Methods

Further Approaches (Co-Training, Transduction)

o Multi-Valued and UB Neurons - I

Why we need the complex valued neurons?

A classical Minsky-Papert’s limitation

Is it possible to learn XOR and Parity n functions using a single neuron?

Multi-Valued and Universal Binary Neurons (MVN and UBN)

Multi-valued mappings

Traditional approaches to learn the multiple-valued mappings on a neuron

Sigmoidal neurons: limitations

Multi-Valued Neuron (MVN)

Multi-valued mappings and multiple-valued logic

Discrete-Valued (k-valued) Activation Function

Multiple-Valued (k-valued) Threshold Functions

Learning Algorithm for the Discrete MVN with the Error-Correction

Learning Rule

Continuous-Valued Activation Function

Learning Algorithm for the Continuous MVN with the Error Correction

Learning Rule

A role of the factor 1/(n+1) in the Learning Rule

Self-Adaptation of the Learning Rate

Modified Learning Rules with the Self-Adaptive Learning Rate

Convergence of the learning algorithm

MVN as a model of a biological neuron

P-realizable Boolean Functions over the field of Complex numbers and a

Universal Binary Neuron

Dependence of the number of sectors on the number of inputs

Learning Algorithm for UBN

Mail Applications

o Kernel PLS

Introduction

• Latent Variables

• The Machine Learning Paradox

• Beyond Regression (PCR)

Principal Component Analysis (PCA)

• Definition

• NIPALS algorithm

• Principal Component Regression (PCR)

• Loading factors and variable selection

Partial Least Squares (PLS)

Nonlinear PLS

• Kernels

• Direct kernel methods

• K-PCA

• K-PLS

• Preprocessing and centering the kernel

• Variable/feature selection with sensitivity analysis

Applications

• Portuguese Wine data

• Pima Indians

• Italian Olive Oils multi-class classification

• Svante Wold’s QSAR data

• Real QSAR data

• Time series prediction

o Multi-Valued and UB Neurons - II

Associative memory

A feedforward multilayer MVN-based neural network (MLMVN), its

derivative-free backpropagation learning algorithm and solving some

classification and prediction problems

Learning of the genetic code using MLMVN

Gene expression data classification using MLMVN

Blur identification using MLMVN

Solving the problem of Gene Expression Patterns

Classification using the MVN-based neural network

Learning of non-threshold Boolean functions using a single

UBN

o Selecting Algorithms and Parameters with Meta-Learning

Background: why is this a problem?

• approximating functions with machine learning

• algorithm selection and bias

• a few solutions

Meta-Learning: THE solution

Meta-learning for Algorithm Recommendation

o Text Mining

What is text mining

Text mining process

Visualizations for text mining

Kernel methods

Case studies

Fingerprinting text

Text categorization

Applying text mining to bioinformatics

Customer service center analysis

Detecting ontologies

Obiectiv 2. Activitate 5.

÷ Strasbourg Summer School on Chemoinformatics: CheminfoS3

÷ Organizator: Louis Pasteur University (ULP), Strasbourg, FR

÷ Tip: şcoală de vară

÷ Perioadă: 20-04 Iunie-Iulie 2008;

÷ Deplasare: aferentă Obiectiv 2, Activitate 5;

÷ Participanţi: Lorentz JÄNTSCHI, Carmen E. STOENOIU;

÷ Cursurile şcolii:

QSAR: discovery and first steps T. Fujita History and challenges of chemoinformatics J. Gasteiger Current trends in chemoinformatics W. Warr Fingerprint Design and Molecular Complexity Effects J. Bajorath Diversity Analysis and Library Design V. Gillet De novo Design G. Schneider Lessons learned from modelling bioactivity - what works and what doesn't R. Glen Exploring novel estrogen receptors and more... T. Oprea Tutorial: Impact of dataset composition on models performance A. Varnek Molecular descriptors: an overview R. Todeschini The good, the bad and the ugly practices of QSAR modelling A. Tropsha Pharmacophore Approach in Drug Discovery T. Langer

Classification of chemical reactions J. Aires-de-Sousa

Machine learning methods in QSAR I. Tetko Tutorial on application of non-linear methods in chemistry (neural networks, support vector machines) I. Baskin

In silico target profiling J. Mestres Docking and post-docking strategies D. Rognan What Crystal Structure Databases Tell us about Conformational Preferences of Drug-like Molecules M. Stahl

The Role of Cheminformatics in the Modern Drug Discovery Process P. Ertl ÷ Puncte cheie din cursuri:

o QSAR: discovery and first steps

Origin of Classical QSAR is from the SAR Studies of Agrochemicals

Plant Growth Regulators/Herbicides

Structure-Activity Patterns

The "Birth" of the Multi-variable Approach

Features of the QSAR

Conditions for the QSAR

Classical QSAR for Series of Substituted Analogs

Process of the Emergence of Biological Activity

Early Trials of the Quantitative Approach

Commercialized Drugs developed with the Aid of Classical QSAR

o History and challenges of chemoinformatics

the scope of chemoinformatics

the beginnings

a field of ist own

scientific challenges

political challenges

o Current trends in chemoinformatics

Literature analysis

Hardware and infrastructure

Web 2.0

The Semantic Web

Text mining

Combichem

Evaluation of scientific methods

o Fingerprint Design and Molecular Complexity Effects

Chemical Similarity Searching

Molecular Fingerprints

Similarity Search

Multiple Active Reference Molecules

Molecular Complexity and Size Effects

Fingerprint Design

Activity-Specific Descriptor Value Ranges

Assessment of Descriptor Selectivity

PDR-FP Descriptor Selection

Similarity Assessment with PDR-FP

Relevance of Complexity Effects

Tversky Similarity

Relevance of Complexity Effects

Activity Classes of Different Avg. Size

Pairwise Tversky Similarity

Complexity Effects

Weighted Tversky Coefficient

Random Reduction of Bit Density

o Diversity Analysis and Library Design

Diversity Analysis

• Measuring diversity

• Selecting diverse subsets

• Computational filtering

Combinatorial Library Design

• Designing libraries optimised on multiple properties

• Reduced Graphs as Molecular Descriptors

o De novo Design

De Novo Design Concepts

Adaptive Walk in a “Fitness Landscape”

What is a Molecule?

Local Neighborhood Search

Local Neighborhood Strategies

Elements of Artificial Adaptive Systems

Ant Colony Optimization. A Simple Combinatorial Case: Peptide Design

Ant System for Combinatorial Design

Principle of Evolutionary Strategies

Algorithm of the (1,λ) Evolution Strategy

De novo Fragment Assembly

Operators of Evolutionary Optimization

Particle Swarm Optimization (PSO)

Visualization of Particle Trajectories

COLIBREE®: Combinatorial Library Breeding

Self-Organizing Map (SOM)

Pharmacophore Road Map of Chemical Space

o Lessons learned from modelling bioactivity - what works and what doesn't

Dynamic pharmacophores in the 5HT1b/d GPCR

• An introduction to designing 5-HT1B ligands

• 5-HT1B pharmacophore development

• Homology modelling based on the beta-2 crystal structure

• Dynamic pharmacophores

• Efficacy models

Moving on to Structure-Activity/Property models - some observations

• How reliable are solubility data?

• ‘Solubility’ in the literature

• So, we have created a Solubility Challenge

• Methods to discover models

• Property behaviour

• So - does (Q)SAR work?

• Overfitting and cross validation: three papers to read by Hawkins

• A simple model example, again using solubility - putting in

parameters that relate to the phenomenon

o Exploring novel estrogen receptors and more...

MLI in Numbers

NM MLSC (3-year summary) U54MH074425

Summary Assays NMMLSC

Integrated Discovery Teams

HyperCyt

Integration of VS & HTS

GPR30 - A Novel Estrogen Target for MLI

2D Similarity

Shape Similarity - ROCS

Electrostatic Similarity - EON

In Silico Screening: Bet on all horses…

Summary of Estrogen Receptors Results

Biomolecular Screening Results

Virtual and Biomolecular Screening Workflow

Probe Discovery At NMMLSC

How Many Drug Targets?

WOMBAT-PK

Measured Data in WOMBAT-PK

Drug Targets & Dis-ease

The Fitness Landscape

Multi-Target Binding Affinity Cliffs

Mono-Target Drugs

Current Drugs Classification

Unique Drug Targets by Class

Urban Legend…

Drug Targets Revisited

From DrugBank

What are the relevant drug metabolizing enzymes?

The Problem with unique lists…

More realistic? Overview of drug metabolism

o Tutorial: Impact of dataset composition on models performance

Software

• R

• Weka

Datasets

Model building

• Descriptors

• Data files

• Obtaining and validation of the models

• Extracting the training and the external related test set from the

Cherkasov dataset

• Build and analyze a Bayesian model

• External validations on unrelated test set

Detection of the bias: profiling of data sets

o Molecular descriptors: an overview

The chemical data

Molecular structure

Some historical notes

Molecular descriptors intro

• The role of the molecular descriptors

• Representations of a molecular structure

• Properties of a molecular descriptor

Molecular descriptors detail

• Molecular graph

• Topological matrices

• Local vertex invariants

• Distance matrix

• Strategies for molecular descriptors

o Următoarele 3 figuri

• QSAR strategy

o models ...

regression models (quantitative response)

classification models (qualitative response)

ranking models (ordered response)

• FAQ -Frequently Asked Questions

• FGA - our Frequently Given Answers

o The good, the bad and the ugly practices of QSAR modelling

Introduction: The need for developing externally validated predictive

models of biological data

Why do models fail (bad practices)

Predictive QSAR Modeling Workflow (good practices)

Examples of the Workflow applications

• QSAR based virtual screening and hit identification

• Consensus QSAR modeling of chemical toxicity

Conclusions: “best”QSAR modeling is a decision support science

• focus on accurate predictions

o Pharmacophore Approach in Drug Discovery

Introduction - Non HTS Hit Recognition

The SOSA Approach

• Concept

• Application Examples

Pharmacophore-based Ligand Profiling

• HT Model Generation

• Software Solutions

• Application Examples

o Classification of chemical reactions

Why do we need to classify reactions?

Representation of reactions

RC (Reaction Classification) numbers

Condensed Reaction Graphs (CRG)

Fingerprints of enzymatic reaction features

Representation of the reaction center with physicochemical parameters

• Representation of reactions by physicochemical properties of the

reaction center

Representation of differences between the structures of products and

reactants

• Daylight fingerprints of reactions

Reaction MOLMAPs

Reaction signatures

Fingerprints of reactions based on atom types

o Machine learning methods in QSAR

Multiple Linear Regression (MLR)

Partial Least Squares (PLS)

Support Vector Regression (SVR)

Back-Propagation Neural Network (BPNN)

K Nearest Neighbours(kNN)

Decision Trees (DT)

o Tutorial on application of non-linear methods in chemistry (neural networks,

support vector machines)

Benchmarking of Different Machine Learning Regression Methods

• Machine Learning Methods

• Datasets and Descriptors

• Files

• Step-by-Step Instructions

o Initialization of the Experimenter mode

o Specification of the list of databases to be processed

o Specification of the list of machine learning methods

o Running machine learning methods

o Analysis of obtained results

Descriptor Selection Bias

• Datasets and Descriptors

• Files

• Modeling

o Internal Cross-Validation using Preliminary Selected

Descriptors

o Internal cross-validation using descriptors selected in

course of model building

o External cross-validation

o In silico target profiling

Traditional drug discovery

High-throughput screening

Chemical Screening

The need to go beyond traditional drug discovery

Pharmacological Profiling

Chemogenomic Profiling

Necessary drug discovery

Annotated chemical libraries: WOMBAT

Chemo and Target spaces covered by WOMBAT

Biologically-relevant descriptors: SHED (Shannon Entropy Descriptors)

Biologically-relevant molecular descriptors

Ligand-based approach to in silico pharmacology

Validation example: nuclear receptor family

Target ID case #1: Drug profiling

Target ID case #2: Targeted chemical biology

o Docking and post-docking strategies

A few starting points

Strategic importance of docking

Docking Flowchart

Which Compound Library?

Commercially-available screening collections

Library set--up

Chemical Filters

Pharmacokinetical filters

Lead-likeness

Which Ligand Conformation?

Which Protein coordinates?

Which Docking Tool?

Docking methods

Conformational sampling methods

Which Scoring function?

Scoring functions

Scoring ΔG bind is extraordinarily difficult

Predicting binding free energies

Empirical scoring functions

Potentials of mean force

Force-fields

Predicting ΔG bind is very difficult

Docking Accuracy

Ranking Accuracy

Source of Docking Errors

Pros and Cons of docking codes

Post-processing

Consensus scoring

Efficient Post-processing

Docking + QSAR

Flexible Protein - Flexible ligand docking

Refining docking poses par MM-PB/SA, MM-GB/SA

Use of topological scoring functions

Post-processing by molecular diversity

Post-processing vHTS results

Post-processing: Visual Inspection

Protein-based virtual screening: Current status

o What Crystal Structure Databases Tell us about Conformational Preferences of

Drug-like Molecules

Conformational Energies Matter

• Strained Bioactive Conformations Affect Binding Energy

Required Generalizations

• Statistics over Recurring Fragments

Coverage of Relevant Substructures

• In Crystal Structure Databases

Cis or Trans? From Amides to Electrostatic Repulsion

• Generalized Allylic Strain

• The Sulfonyl Group

• Properties of Aniline Derivatives

• Project Example: New F.VIIaInhibitors

o The Role of Cheminformatics in the Modern Drug Discovery Process

Data Explosion in Chemistry

Cheminformatics in the Pharma Industry

Drug Discovery & Development Process

Typical Cheminformatics Activities at Pharmaceutical Industry

• Molecular databases

• Large-scale data analysis, knowledge discovery

• Calculation of molecular properties / descriptors

• Estimation of ADME characteristics, toxicity alerting

• Navigation in chemistry space

• Virtual screening

• Support for HTS - hitlist triaging

• Support for combinatorial chemistry and molecule optimization

Novartis Web-based Cheminformatics System

• Novartis Data Warehouse - Avalon

• Classification of GPCR Ligands

• Novartis In Silico Profiling

• 3D Hydrophobicity

• Molecular Property Space

• Structural Diversity Space

The Scaffold Tree - Basic Algorithm

• Scaffold Tree Example for HTS results

Virtual Screening

• Virtual Screening Workflow

• Learning from the Nature

High-Throughput Screening - HTS

Combinatorial Chemistry Molecule Design

• Early CombiChem

• Database of Organic Substituents

Bioisosteric Design

• Substituent Bioisosteric Design

Cheminformatics - Future Trends

Obiectiv 3. Activitate 9.

÷ Fourth International Conference of Applied Mathematics and Computing

÷ Organizator: Technical University of Plovdiv (TUP), Plovdiv, BG

÷ Tip: conferinţă internaţională

÷ Perioadă: 11-19 August 2008;

÷ Deplasare: aferentă Obiectiv 3, Activitate 9;

÷ Participanţi: Lorentz JÄNTSCHI, Carmen E. STOENOIU;

÷ Secţiuni ştiinţifice:

o Combinatorics;

o Graph theory;

o ODE, PDE, difference equations;

o Functional equations;

o Integral and differential inequalities and inclusions;

o Differential games;

o Control theory;

o Dynamical systems;

o Probability, statistics and stochastic processes;

o Statistical mechanics;

o Quantum theory;

o Relativity and gravitational theory;

o Integral and differential operators;

o Fractional calculus;

o Special functions;

o Generalized functions;

o Operator research and algebraic analysis;

o Fluid mechanics;

o Mechanics of particles and systems;

o Mathematical programming and optimization;

o Approximation theory;

o Numerical algebraic or transcendental equations;

o Numerical analysis for ordinary differential equations;

o Numerical analysis for partial differential equations;

o Numerical methods in complex analysis;

o Numerical methods in linear algebra;

o Numerical simulation;

o Acceleration of convergence;

o Interval arithmetic;

o Information systems;

o Software engineering;

o Software technology;

o System theory;

o Theory of data;

o Programming and image processing;

o Pattern recognition;

o Parallel and distributed algorithms;

o Communication systems;

o Computer aided design;

o Computer arithmetic and numerical analysis;

o Computer aspects of numerical algorithms;

o Computer networks;

o Concurrent and parallel computations;

o Data base;

o Discrete mathematics in relation to computer science;

o Manufacturing systems;

o Applications in mechanics, physics, chemistry, biology, technology, economics

and industrial problems.

÷ 17th European Symposium on Quantitative Structure-Activity Relationships & Omics

Technologies and Systems Biology

÷ Organizator: The Cheminformatics and QSAR Society (CI-QSAR), Uppsala, SE

÷ Tip: simpozion

÷ Perioadă: 20-27 Septembrie 2008;

÷ Deplasare: aferentă Obiectiv 3, Activitate 9;

÷ Participanţi: Lorentz JÄNTSCHI;

÷ Prezentări:

o Session 1: QSAR in OMICS and Systems Biology

2008:09:22:09.00: Top-Down Systems Biology and Integrative

Approaches to Superorganism Medicine

2008:09:22:10.00: Systems chemical biological studies on enzymatic

metabolic networks and inhibitors

2008:09:22:11.00: Potentialities of PLSand OPLS in 'OMICS' cancer

diagnostics and elucidation of antiumour drugs mechanism of action

2008:09:22:11.20: Building Blocks for Metabolic simulation: Automated

elucidation of metabolite structures

2008:09:22:11.40: Theoretical structural metabolomics

2008:09:22:12.00: QSAR: dead or alive?

o Session 2: QSAR

2008:09:22:14.00: Beyond QSAR

2008:09:22:14.50: Linking chemical and biological similarity of small

molecules

2008:09:22:15.10: A Novel Conservative design for fast followers -

Focused Hierarchical design of a peptide library targeted at M.

tuberculosis Ribonucleotid reductase

2008:09:22:16.00: A QSAR study on indole-based PPAR-y agonists in

respect to receptor binding and gene transactivation data

2008:09:22:16.20: QSAR modelling of small datasets

2008:09:22:16.40: QSAR for Estimation of human volume of distribution

2008:09:22:17.00: Development of Fast, Interpretable 2D pharmacophore

models for predicting hERG and NaV1.5 Cardiac Ion Channel safety

liabilities using TRUST fingerprints

2008:09:22:17.20: Global or local QSAR: is there a way out?

o Session 3: QSAR and Natural Product Medicine

2008:09:23:09.00: PLS-Trees and QSAR

2008:09:23:09.45: Metabolomics in nutritional studies

2008:09:23:12.00: SIRC/TCM: a Database of Traditional Chinese

Medicine

o Session 4: Molecular Modeling and Chemical Properties

2008:09:23:14.00: Does pKa predictions matter anymore?

2008:09:23:14.50: Cytotoxicity and 3D-QSAR Analysis of Lmaellarind

against human hormone dependent breast cancer (T47D) and Humane

hormone independent breast cancer (MDA-MB231)

2008:09:23:15.10: GABAa and GABAc Receptors: Molecular modelling

and QSAR analysis of selective ligands

2008:09:23:15.30: Fast and accurate method for flexible ligand

superposition and shape-based screening

2008:09:23:16.20: Predicted 3D structures for Coupled Receptors G-

Protein and ligand-GPCR complexes for agonists, antagonists, and

inverse agonists

2008:09:23:17.00: Design of New Chemical Entities as selective COX-2

inhibitors using Structure optimisation by QSAR

2008:09:23:17.20: A novel 3D QSAR metod exploiting protein flexibility

to kinase inhibition

2008:09:23:17.40: An automated metod to interface ligand- and structure-

based drug design

o Session 5: Combinatorial Chemistry and Virtual Screening

2008:09:24:09.00: From Molecular Interaction Fields to Enzyme

Inhibitors and Biochemical Networks

2008:09:24:09.45 : Minimizing Benchmark Dataset Bias in Ligand Based

viritual screening by maximum unbiased validation (MUV) Datasets

2008:09:24:10.05: Data mining and comperative analysis of

chemosensitivity and gene expression profiles for human tumor cell lines

o Session 6: QSAR in Toxicology and Environmental Research

2008:09:24:10.50: Human and mammalian toxic equivalency factors for

dioxins and dioxin-like compounds: The who 2005 re-evaluation

2008:09:24:11.35: A combined use of in vitro screening and

cheminformatics approaches improves the accuracy of in vivo toxicity

prediction for environmental chemicals

2008:09:24:12.05: Prediction of cytochrome P450 inhibition by different

approaches of QSAR modeling

o Session 7: Case Studies in QSAR

2008:09:25:09.00: Understanding QSAR: Do we always use the correct

structural models to establish affinity correlation?

2008:09:25:09.50: Computer-aided drug design for the beta2-adrenergic

receptor

2008:09:25:12.00: QSAR investigation of novel compounds targeting the

serotonin receptors

2008:09:25:12.20: Docking and viritual screening for virus targets

exploiting distributed grid technology

o Session 8: QSAR in Chemical Risk Assessment

2008:09:25:14.00: Advances in Toxico-Cheminformatics: Supporting a

New Paradigm for Predictive Toxicology

2008:09:25:14.45: Use of structural alerts to screen EINECS for

substances of very high concern

2008:09:25:15.05: Predicting Toxicity from Non-Test Data: Utilising in

silico and in chemico information for Risk assessment

2008:09:25:16.00: Computational Ecotoxicology to predict

Biomagnification of contaminants

2008:09:25:16.20: Similarity based assessment of Model applicability

domain and quantitative evaluation of reliability of the prediction

2008:09:25:16.40: Using all the data in comprehensive risk assessment of

the mutagenetic potential of drugs

2008:09:25:17.00: Human Monitoring of Phtalates and Chemical Risk

Assessment

o Session 9: Emerging Technologies

2008:09:26:09.00: Complex systems, QSAR, and control of stem cell fate

2008:09:26:09.50: Proteochemometrics

2008:09:26:10.10: From Mathematical chemistry to quantum and

medicinal chemistry through genetic algorithms

2008:09:26:10.50 GAUDI navigator, a new data mining platform

Identificarea metodelor de analiză (Obiectiv: management cunoştinţe)

Chimie Matematică

Studiul sistematic prin instrumente specifice de chimie matematică a fost iniţiat de Crum-

Brown şi Fraser în 1868 prin lucrarea [On the connection between chemical constitution and

physiological action. Part 1. On the physiological action of the salts of the ammonium bases, derived from

Strychnia, Brucia, Thebia, Codeia, Morphia, and Nicotia, Trans R Soc Edinb 25:151-203].

Un pas important în domeniul chimie matematice s-a făcut prin introducerea noţiunii de graf

de către Sylvester în 1874 prin lucrarea [On an Application of the New Atomic Theory to the Graphical

Representation of the Invariants and Covariants of Binary Quantics - With Three Appendices, Am J Math, 1,

64-90] şi odată cu aceasta s-au deschis posibilităţile de explorare a topologiei moleculare. O serie de

monografii au revizuit şi complectat de-a lungul timpului conceptele de teoria grafurilor [(Harary,

1969): Graph Theory, Addison - Wesley, Reading, MA], aplicaţiile grafurilor în chimie [(Kier şi Hall,

1976): Molecular Connectivity in Chemistry and Drug Research, Acad Press, New York, NY], teoria

grafurilor chimice [(Trinajstic, 1983): Chemical Graph Theory, CRC Press, Boca Raton, FL], şi ceea ce

facem referire a fi topologia moleculară [(Diudea şi alţii, 2001 & 2002): Molecular Topology, Nova,

Hutington, NY]. Modelele matematice ale structurii chimice includ:

÷ reprezentarea tridimensională (şi aici se face apel la Chimia Cuantică);

÷ reprezentarea bidimensională (sub formă de formule structurale) numite grafuri moleculare;

÷ reprezentarea sub formă de grafuri neorientate în care vârfurile sunt atomi şi legăturile sunt

muchii;

Teoria grafurilor aplicată în studiul structurilor moleculare reprezintă o ştiinţă

interdisciplinară, numită teoria grafurilor chimice sau topologie moleculară. Prin utilizarea

instrumentelor imprumutate din teoria grafurilor, teoria seturilor şi statistică se încearcă

identificarea facilităţilor structurale implicate în relaţiile structură-activitate. Partiţia proprietăţii

moleculare şi recombinarea valorilor sale fragmentale prin modele aditive este unul dintre

obiectivele principale. Caracterizarea topologică a structurilor chimice permite clasificarea

moleculelor şi modelarea structurilor necunoscute cu proprietăţi dorite.

Noţiuni prealabile

÷ Observaţie - o activitate ce consistă în recepţionarea cunoaşterii prin intermediul simţurilor sau

al instrumentelor:

o Observaţia presupune existenţa unui observator şi a unei observabile;

o Recepţionarea cunoaşterii presupune abstractizarea rezultatului observaţiei;

÷ Măsurare - o activitate ce presupune executarea a două operaţii: observarea şi înregistrarea

rezultatelor observaţiei şi depinde de:

o natura obiectului (material) observat;

o natura fenomenului (imaterial) observat;

o de modalitatea de măsurare şi înregistrare a rezultatelor observaţiei.

÷ Element (`e`): un obiect al unei observaţii sau al unei abstractizări;

÷ Proprietate (`|(e)`): rezultatul unei operaţii de măsurare asupra unui element (`e`);

÷ Mulţime (`S`): o colecţie de elemente (`e`) distincte (ordinea nu este relevantă);

o Remarcă: de obicei o mulţime se constituie din elemente supuse observaţiei unei

proprietăţi;

÷ Mulţimea vidă (`∅`): o mulţime care nu conţine nici un element;

÷ Valoare de adevăr - abstractizare binară (cu 2 valori posibile) a rezultatului unei observaţii:

favorabile (`T` sau `0`) sau nefavorabile (`F` sau `1`);

o Remarcă: valoarea de adevăr este o proprietate (|(e)=0 sau |(e)=1);

÷ Identitatea logică (`≡`): exprimă faptul că rezultatul unei operaţii de măsurare asupra a două

elemente este acelaşi;

÷ Negaţia logică (¬): o operaţie care transformă o valoare de adevăr în contrariul său (¬0→1;

¬1→0; ¬T→F; ¬F→T);

÷ Apartenenţă (la o mulţime): proprietatea unui element de a face parte (∈) sau nu (∉) dintr-o

mulţime;

o Consecinţă:

Apartenenţa unui element la o mulţime are o valoare de adevăr (`∈` ≡ `T` ≡ `0`;

`∉` ≡ `F` ≡ `1`);

÷ Submulţime (`⊆`): S1⊆S ⇔ [∀e∈S1 ⇒ e∈S]

÷ Produs cartezian (`×`): S1×S2 = {(e1,e2) | e1∈S1 şi e2∈S2};

÷ Relaţie binară (`2-r`): R ⊆ S1×S2;

÷ Endorelaţie binară (`2-e-r`): R ⊆ S×S;

÷ Proprietăţi ale endorelaţiilor binare:

o Reflexivitate (`re`): R `re` ⇔ [∀e∈S ⇒ eRe];

o Ireflexivitate (`ir`): R `ir` ⇔ [∀e∈S ⇒ ¬ eRe];

o Coreflexivitate (`cr`): R `cr` ⇔ [∀e1,e2∈S | e1Re2 ⇒ e1≡e2];

o Simetrie (`sy`): R `sy` ⇔ [∀e1,e2∈S | e1Re2 ⇒ e2Re1];

o Antisimetrie (`ns`): R `ns` ⇔ [∀e1,e2∈S | e1Re2 şi e2Re1 ⇒ e1≡e2];

o Asimetrie (`as`): R `as` ⇔ [∀e1,e2∈S | e1Re2 ⇒ ¬ e2Re1];

o Tranzitivitate (`ts`): R `ts` ⇔ [∀e1,e2,e3∈S | e1Re2 şi e2Re3 ⇒ e1Re3];

o Totală (`li`): R `li` ⇔ [∀e1,e2∈S ⇒ e1Re2 sau e2Re1];

o Trihotomă (`tc`): R `tc` ⇔ [∀e1,e2∈S ⇒ !(e1Re2 sau e2Re1 sau e1≡e2)]; ! = exact una din

o Euclidiană (`eu`): R `eu` ⇔ [∀e1,e2,e3∈S | e1Re2 şi e1Re3 ⇒ e2Re3];

o Serială (`se`): R `se` ⇔ [∀e1∈S ∃s2∈S | e1Re2];

o Echivalenţă (`eq`): R `eq` ⇔ R `re` şi R `sy` şi R `ts`;

o Ordine parţială (`po`): R `po` ⇔ R `re` şi R `ns` şi R `ts`;

o Ordine totală (`to`): R `to` ⇔ R `po` şi R `li`;

o Bine ordonată (`wo`): R `wo` ⇔ R `to` şi ¬ R `se`;

o R `sy` şi R `ts` şi R `se` ⇒ R `re`;

÷ Exemple de relaţii binare:

o Relaţia `=`:

reflexivă: ∀e ⇒ e = e;

coreflexivă: ∀e1,e2 | e1 = e2 ⇒ e1 ≡ e2;

simetrică: ∀e1,e2 | e1 = e2 ⇒ e2 = e1;

antisimetrică: ∀e1,e2 | e1 = e2 şi e2 = e1 ⇒ e1 ≡ e2;

tranzitivă: ∀e1,e2,e3 | e1 = e2 şi e2 = e3 ⇒ e1 = e3;

euclidiană: ∀e1,e2,e3 | e1 = e2 şi e1 = e3 ⇒ e2 = e3;

echivalenţă: = `re`, `sy`, `ts`;

o Relaţia `≤`:

reflexivă: ∀e ⇒ e ≤ e;

antisimetrică: ∀e1,e2 | e1 ≤ e2 şi e2 ≤ e1 ⇒ e1 ≡ e2;

tranzitivă: ∀e1,e2,e3 | e1 ≤ e2 şi e2 ≤ e3 ⇒ e1 ≤ e3;

totală: ∀e1,e2 ⇒ e1 ≤ e2 sau e2 ≤ e1;

serială: ∀e1 ∃s2 | e1 ≤ e2;

ordine parţială: ≤ `re`, `ns`, `ts`;

ordine totală: ≤ `re`, `ns`, `ts`, `li`;

o Relaţia `<`:

ireflexivă: ∀e ¬ e < e;

asimetrică: ∀e1,e2 | e1 < e2 ⇒ ¬ e2 < e1;

tranzitivă: ∀e1,e2,e3 | e1 < e2 şi e2 < e3 ⇒ e1 < e3;

trihotomă: ∀e1,e2 ⇒ !(e1 < e2 sau e2 < e1 sau e1 ≡ e2);

serială ⇔ ∀e1 ∃s2 | e1 < e2;

o Relaţia `⊆`:

reflexivă: ∀S ⇒ S ⊆ S;

antisimetrică: ∀S1,S2 | S1 ⊆ S2 şi S2 ⊆ S1 ⇒ S1 ≡ S2;

tranzitivă: ∀S1,S2,S3 | S1 ⊆ S2 şi S2 ⊆ S3 ⇒ S1 ≤ S3;

serială pe mulţimea submulţimilor unei mulţimi ℘(S);

ordine parţială: ⊆ `re`, `ns`, `ts`;

o Relaţia `≠`:

ireflexivă: ∀e ⇒ ¬ e ≠ e;

simetrică: ∀e1,e2 | e1 ≠ e2 ⇒ e2 ≠ e1;

o Relaţia `străbun al` şi `descendent al`:

tranzitivă: A `descendent al` B şi B `descendent al` C ⇒ A `descendent al` C;

o Relaţia distanţă euclidiană finită:

reflexivă: ∀x ⇒ d(x,x)=0 < ∞;

simetrică: ∀x,y ⇒ d(x,y) < ∞ ⇒ d(y,x) < ∞;

tranzitivă: ∀x,y,z | d(x,y) < ∞ şi d(y,z) < ∞ ⇒ d(x,z) < ∞;

euclidiană: ∀x,y,z | d(x,y) < ∞ şi d(x,z) < ∞ ⇒ d(y,z) < ∞;

serială: ∀x ∃y=x | d(x,y)=d(x,x)=0 < ∞;

echivalenţă: d(·,·) < ∞ `re`, `sy`, `ts`;

o Relaţia funcţie definită f:X→Y, y=f(x):

serială: ∀x ∃y | y=f(x);

valoare unică: ∀x,y1,y2 | f(x)=y1 şi f(x)=y2 ⇒ y1≡y2;

injectivă ⇔ ∀x,y | x ≠ y ⇒ f(x) ≠ f(y);

surjectivă ⇔ ∀y ∃x | y=f(x);

bijectivă ⇔ injectivă şi surjectivă;

÷ Funcţie de numărare: o funcţie bijectivă definită pe o mulţime cu valori într-o submulţime a

numerelor naturale;

o Consecinţă: funcţia de numărare induce în codomeniu o relaţie de ordine totală;

÷ Mulţime infinită: o mulţime pe care se poate defini o funcţie de numărare şi orice funcţie de

numărare induce o relaţie de ordine totală;

÷ Mulţime finită: o mulţime pe se poate defini o funcţie de numărare, dar nu există nici o funcţie

de numărare care induce relaţie de ordine totală;

÷ Mulţime de puterea continuului: o mulţime pe care nu se poate defini o funcţie de numărare;

o Consecinţă: orice mulţime de puterea continuului (pe care nu se poate defini o funcţie de

numărare) are acelaşi număr de elemente cu mulţimea funcţiilor {f: ℕ → {0,1}}, adică

2|ℕ|; demonstraţia constă în construcţia unei funcţii bijective între mulţimea funcţiilor

{f:ℕ→{0,1}} şi intervalul de numere reale [0,1) folosind exprimarea numerelor din

intervalul [0,1) în baza de numeraţie 2 (r01=0.f1f2...);

÷ Şir: o mulţime pe care s-a definit o funcţie de numărare;

÷ Şir parţial ordonat: şir în care elementele se află în relaţie de ordine parţială;

÷ Şir total ordonat: şir în care elementele se află în relaţie de ordine totală;

Noţiuni de bază

Un graf G = G(V,E) este o pereche de două mulţimi, V - mulţime finită nevidă ale cărei

elemente se numesc vârfuri (v∈V) şi E - mulţime de perechi de vârfuri (e∈E), care implementează

o (endo-)relaţie binară pe mulţimea V. Două vârfuri vi,vj∈V se numesc adiacente dacă (vi,vj)∈E.

Două perechi de vârfuri (vi1,vj1) şi (vi2,vj2) se numesc adiacente dacă au un vârf comun (i1 = i2 sau i1

= j2 sau j1 = i1 sau j1 = j2).

Următoarele remarci caracterizează grafurile chimice:

÷ În general relaţia definită de E este ireflexivă (pentru orice v∈V, (v,v)∉E);

÷ Dacă relaţia definită de E este simetrică (dacă (v1,v2)∈E atunci (v2,v1)∈E) atunci elementele lui

E se numesc muchii, altfel se numesc arce;

÷ Atunci când se face referinţă la un anume graf G, se notează V = V(G), E = E(G), |V| = N(G), şi

|E| = Q(G); mărimile N(G) şi Q(G) permit transformarea grafului G prin izomorfisme de

numerotare în grafuri (relaţii bijective sau corespondenţe 1 la 1) ale căror vârfuri sunt din

mulţimea {1..N}; într-un astfel de izomorfism, vârfului vi∈V îi poate fi asociat numărul

i∈{1..N} iar muchiei (vi,vj)∈E perechea de numere (i,j)∈{1..N}×{1..N};

÷ Grafului G=(V,E) îi poate fi asociată o pereche de mulţimi de ponderi WG=(WV,WE), în care

fiecărui element v∈V îi corespunde un element wv∈WV (wv numit caracteristica vârfului v) şi

în care fiecărui element e∈E îi corespunde un element we∈WE (we numit caracteristica

muchiei e); ponderile pentru vârfuri sunt asociate proprietăţilor atomice (cum sunt tipul

atomului şi valenţa) în timp ce ponderile pentru muchii sunt asociate proprietăţilor de legătură

(cum sunt tipul legăturii şi lungimea).

În tabelul următor sunt ilustrate câteva utilizări ale diferitelor tipuri de grafuri în teoria

grafurilor chimice.

Tabelul 1. Tipuri de grafuri chimice Graf, G Semnificaţie Tip Reprezentare (V,E) Utilizare

Dacă vârfurile reprezintă sisteme chimice atunci graful reprezintă o reacţie cu preechilibru

orientat neponderat

V={1, 2, 3} E={(1,2), (2,1), (2,3)}

Grafuri de reacţie

k1k2 k3 Dacă vârfurile reprezintă sisteme chimice atunci graful reprezintă o reacţie cu preechilibru

orientat ponderat

V={1, 2, 3} E={(1,2), (2,1), (1,3)} VW={k2, k1, k3}

Grafuri de reacţie

N Cu N Graful reprezintă azanul de cupru

orientat ponderat

V={1, 2, 3} E={(1,2), (3,2)} WV={N, Cu, N}

Chimia complecşilor coordinativi

Dacă vârfurile reprezintă atomi de carbon şi atomii de hidrogen sunt neglijaţi, atunci graful reprezintă propanona

neorientat ponderat

V={1, 2, 3} E={(1,2), (2,1), (2,3), (3,2)} WE={1, 1, 2, 2}

Structuri alcătuite din atomi de acelaşi tip (uzual atomi de carbon)

Dacă vârfurile reprezintă atomi de carbon şi atomii de hidrogen sunt neglijaţi, atunci graful reprezintă izobutanul

neorientat neponderat

V={1, 2, 3, 4} E={(1,4), (4,1), (2,4), (4,2), (3,4), (4,3)}

Structuri alcătuite din atomi şi legături de acelaşi tip

N

Dacă vârfurile nemarcate reprezintă atomi de carbon şi atomii de hidrogen sunt neglijaţi, atunci graful reprezintă vinilamina

neorientat ponderat

V={1, 2, 3} E={(1,2), (2,1), (2,3), (3,2)} WV={N, C, C} WE={1, 1, 2, 2}

Structuri fără legături coordinative

Aşa cum se observă şi din tabelul de mai sus, două categorii de grafuri sunt de interes pentru

topologia moleculară:

÷ Grafurile neorientate şi neponderate, ce conferă maximă generalitate pentru studiul

proprietăţilor graf-teoretice;

÷ Grafurile neorientate şi ponderate, ce conferă maximă specificitate pentru studiul grafurilor

moleculare.

Se uzează de o serie de noţiuni fundamentale de teoria grafurilor, redate în continuare:

÷ Drum: v1...vk∈W(G) dacă (vi,vi+1)∈E pentru 1≤i<k unde prin W(G) s-a notat mulţimea

drumurilor în G;

÷ Drum închis: v1...vk∈W(G) este închis dacă v1=vk;

÷ Dâră: v1...vk∈T(G) dacă (vi,vi+1)∈E pentru 1≤i<k şi (vi+j,vi+j+1)≠(vi,vi+1) pentru 1≤i+j<k, 1<j

unde prin T(G) s-a notat mulţimea dârelor în G;

÷ Dâră închisă: v1...vkv1 dâră închisă dacă v1...vk∈T(G) şi (vk,v1)∈E(G);

÷ Cale: v1...vk∈P(G) dacă (vi,vj)∈E pentru 1≤i<j≤k (v1...vk drum) şi vi≠vj pentru 1≤i<j≤k unde

prin P(G) s-a notat mulţimea căilor în G;

÷ Cale închisă: v1...vkv1 cale închisă dacă v1...vk∈P(G) şi (vk,v1)∈E(G); calea închisă se numeşte

ciclu; mulţimea ciclurilor se notează cu C(G);

÷ Cale terminală: v1...vk∈TP(G) dacă v1...vk∈P(G) şi ∀v∈V(G), v1...vkv∉P(G);

÷ Cale Hamiltoniană: v1...vN(G)∈H(G) dacă v1...vN(G)∈P(G);

÷ Circuit Hamiltonian: v1...vN(G)v1∈HC(G) dacă v1...vN(G)∈H(G) şi (vN(G),v1)∈E(G);

÷ Subgraf (≤): SG=SG(SV,SE)≤G(V,E)=G ⇔ SG graf, SV⊆V şi SE⊆E;

÷ Graf complet: KN=({1..N},{(i,j),(j,i) | 1≤i<j≤N}; într-un graf complet între oricare două vârfuri

există o muchie; tabelul de mai jos redă primele 6 grafuri complete (K1..K6):

Tabelul 2. Primele 6 grafuri complete

· K1 K2 K3 K4 K5 K6

÷ Graf bipartit (bigraf): G=G(V1∪V2,E) bigraf ⇔ [∅=V1∩V2; (vi,vj)∈E ⇒ (vi∈V1, vj∈V2) sau

(vi∈V2, vj∈V1)]; într-un graf bipartit toate muchiile au un vârf din prima partiţie şi celălalt din a

doua partiţie; tabelul de mai jos dă numărul de grafuri bipartite în funcţie de dimensiunea

partiţiilor:

Tabelul 3. Numărul de grafuri bipartite în funcţie de dimensiunea partiţiilor pentru |V|≤10

|V1| vs. |V2| 2 3 4 5 1 1 1 1 12 2 4 6 93 10 34 764 93 5585 1897

÷ Graf bipartit complet: K|V1|,|V2|=G(V1∪V2,E) bigraf complet ⇔ [∅=V1∩V2; (vi,vj)∈E ⇔

(vi∈V1, vj∈V2) sau (vi∈V2, vj∈V1)]; într-un graf bipartit complet toate muchiile au un vârf din

prima partiţie şi celălalt din a doua partiţie şi orice pereche de vârfuri unul dintr-o partiţie şi

celalalt din a doua partiţie este muchie; următorul tabel enumeră toate grafurile bipartite

complete Km,n până la K4,4 (m≤n):

Tabelul 4. Toate grafurile bipartite complete Km,n pentru 1 ≤ m ≤ n ≤ 4

Km,m n=1 n=2 n=3 n=4

m=1 A B B A B

B

AB B

BA

B

BB

m=2

A

BB

A

B

A

B

A

B

A

B BB B

A

m=3

BA B A

BA

A A A

B

B

B

B

m=4

B B

A

B B

AA

A

÷ Graf planar: G=G(V,E) este planar dacă poate fi desenat în plan astfel încât două muchii să se

intersecteze cel mult în capetele (vârfurile) lor; pentru un graf planar se definesc feţele (F); o

faţă (f∈F) a unui graf planar este un ciclu care are cel mult o muchie comună cu celelalte cicluri

ale grafului; între numărul de feţe |F|, de vârfuri |V| şi muchii |E| se stabileşte relaţia Euler [Euler

L. Solutio Problematis ad Geometriam Situs Pertinentis. Comment Acad Sci I Petropolitanae

1736;8:128-140]: |V|-|E|+|F|=2; un graf este planar ⇔ nu există subgrafuri ale lui G homeomorfe

cu K5 sau K3,3 (redate în figura de mai jos), rezultat stabilit de Kuratowski [Kuratowski K. Sur le

Problème des Courbes Gauches en Topologie. Fund Math 1930;15:271-283], dar care oricum nu ajută

prea mult în practică, deoarece problema determinării dacă H homeomorf al lui G este o

problemă dificilă NP-completă (timpul necesar pentru a o rezolva creşte foarte repede cu

dimensiunea grafurilor); tabelul de mai jos redă transformarea unui graf astfel încât muchiile să

nu se intersecteze:

Tabelul 5. Exemplu de trasformare a unui graf la graf planar

1 2

3

4

5

5

1

3

2

4

f1f2

f3

Două transformări aplicate unui graf prezintă importanţă:

÷ Graful linie: L(G)=(LV,LE) graf linie al lui G=(V,E) se obţine astfel:

o i∈LV ⇔ ei∈E;

o (i,j)∈LE ⇔ ei şi ej sunt adiacente.

÷ Graful complementar: G=G(V,E) complementar lui G=G(V,E) ⇔ E=V×V\E.

Tabelul următor prezintă cele două transformări aplicate unui graf:

Tabelul 6. Exemplu de obţinere a grafului linie şi grafului complementar G L(G) G L(G)

Dacă dragul nu este complet, atunci numerotarea induce izomorfie (de numerotare). Două

grafuri G1=G1(V,E) şi G2=G2(V,E) sunt izomorfe dacă există fiz astfel încât:

÷ fiz:V(G1)→V(G2);

÷ ∀v1∈V(G1) ∃! v2∈V(G2) a.î. v1=fiz(v2);

÷ ∀v2∈V(G2), ∃! v1∈V(G1) a.î. v1=fiz(v2);

÷ ∀(vi,vj)∈V(G1) ⇒ (fiz(vi),fiz(vj))∈V(G2);

÷ ∀(vi,vj)∈V(G2) ⇒ (fiz-1(vi),fiz

-1(vj))∈V(G1).

În tabelul următor sunt redate două exemple de grafuri, primul în care numerotarea induce

izomorfia de numerotare şi al doilea în care numerotarea nu induce izomorfie (cazul grafurilor

complete), unde pentru simplitate s-au enumerat muchiile o singură dată:

Tabelul 7. Două exemple de grafuri şi izomorfia de numerotare

Caz Numerotare Reprezentare

4

32 1

4

32 1 V={1, 2, 3, 4}

E={(1,2), (2,3), (3,4), (2,4)}

1 2

43 1

2

43 1 f1(1)=1; f1(2)=3; f1(3)=2/4; f1(4)=4/2;

2 2

34 1

2

34 1 f2(1)=1; f2(2)=4; f2(3)=3/2; f2(4)=2/3;

3 4

31 2

4

31 2 f3(1)=2; f3(2)=1; f3(3)=3/4; f3(4)=4/3;

4 4

13 2

4

13 2 f4(1)=2; f4(2)=3; f4(3)=4/1; f4(4)=1/4;

5 3

14 2

3

14 2 f5(1)=2; f5(2)=4; f5(3)=1/3; f5(4)=3/1;

6 4

21 3

4

21 3 f6(1)=3; f6(2)=1; f6(3)=2/4; f6(4)=4/2;

7 4

12 3

4

12 3 f7(1)=3; f7(2)=2; f7(3)=1/4; f7(4)=4/1;

8 1

24 3

1

24 3 f8(1)=3; f8(2)=4; f8(3)=1/2; f8(4)=2/1;

9 3

21 4

3

21 4 f9(1)=4; f9(2)=1; f9(3)=3/2; f9(4)=2/3;

10 3

12 4

3

12 4 f10(1)=4; f10(2)=2; f10(3)=3/1; f10(4)=1/3;

11 2

13 4

2

13 4 f11(1)=1; f11(2)=3; f11(3)=2/4; f11(4)=4/2;

3

21

32

1

3

21

V={1, 2, 3} E={(1,2), (1,3), (2,3)}

- - - Analiza căilor şi ciclurilor în grafuri este de o importanţă deosebită pentru topologia

moleculară. Astfel se folosesc următoarele noţiuni:

÷ Lungime a unui drum: k | v1...vk∈W(G)

÷ Distanţă: di,j=min{k | v1...vk∈P(G), v1=vi, vk=vj}

÷ Detur: δi,j=max{k | v1...vk∈P(G), v1=vi, vk=vj}

÷ Excentricitate: ecci=max{di,j}

÷ Rază: r(G)=min{ecci}

÷ Diametru: d(G)=max{ecci}

÷ Căi distanţă: v1...vk∈D(G) ⇔ v1...vk∈P(G) şi d1,k=k-1

÷ Căi detur: v1...vk∈Δ(G) ⇔ v1...vk∈P(G) şi δ1,k=k-1

Tabelul următor exemplifică noţiunile de mai sus pe un graf:

Tabelul 8. Drum, distanţă, detur, excentricitate, rază, diametru şi căi în grafuri

1

23 4

6

5

Drumuri în graf

Există o infinitate

Drumuri de lungime dată

De lungime 2: ÷ 121; 131; 212; 232; 313; 323; 343; 434; 454; 464; 545; 565; 656; 646; ÷ 123; 132; 134; 213; 231; 234; 312; 321; 345; 346; 431; 432; 456; 465; 543; 546;

564; 654; 645; 643; Distanţă d1,2=1; d1,3=1; d1,4=2; d1,5=3; d1,6=3;

d2,1=1; d2,3=1; d2,4=2; d2,5=3; d2,6=3; d3,1=1; d3,2=1; d3,4=1; d3,5=2; d3,6=2; d4,1=2; d4,2=2; d4,3=1; d4,5=1; d4,6=1; d5,1=3; d5,2=3; d5,3=2; d5,4=1; d5,6=1; d6,1=3; d6,2=3; d6,3=2; d6,4=1; d6,5=1;

Detur

δ1,2=2; δ1,3=2; δ1,4=3; δ1,5=5; δ1,6=5; δ2,1=2; δ2,3=2; δ2,4=3; δ2,5=5; δ2,6=5; δ3,1=2; δ3,2=2; δ3,4=1; δ3,5=3; δ3,6=3; δ4,1=3; δ4,2=3; δ4,3=1; δ4,5=2; δ4,6=2;

δ5,1=5; δ5,2=5; δ5,3=3; δ5,4=2; δ5,6=2; δ6,1=5; δ6,2=5; δ6,3=3; δ6,4=2; δ6,5=2;

Excentricitate ecc1=3; ecc2=3; ecc3=2; ecc4=2; ecc5=3; ecc6=3; Rază r=2; Diametru d=3; Căi 12; 123; 1234; 12345; 12346; 123456; 123465;

13; 132; 134; 1345; 1346; 13456; 13465; 21; 213; 2134; 21345; 213456; 213465; 23; 231; 234; 2345; 2346; 23456; 23465; 31; 32; 312; 321; 34; 345; 346; 3456; 3465; 45; 46; 456; 465; 43; 431; 4312; 432; 4321; 56; 564; 5643; 56431; 56432; 564312; 564321; 65; 654; 6543; 65431; 65432; 654312; 654321;

Căi terminale 123456; 123465; 132; 13456; 13465; 213456; 213465; 231; 23456; 23465; 312; 321; 3456; 3465; 456; 465; 4321; 4312; 564312; 564321; 54312; 54321; 546; 645; 64312; 64321; 654312; 654321;

Căi distanţă D1,2={12}; D1,3={13}; D1,4={134}; D1,5={1345}; D1,6={1346} D2,1={21}; D2,3={23}; D2,4={234}; D2,5={2345}; D2,6={2346} D3,1={31}; D3,2={32}; D3,4={34}; D3,5={345}; D3,6={346} D4,1={431}; D4,2={432}; D4,3={43}; D4,5={45}; D4,6={46} D5,1={5431}; D5,2={5432}; D5,3={543}; D5,4={54}; D5,6={56} D6,1={6431}; D6,2={6432}; D6,3={643}; D6,4={64}; D6,5={65}

Căi detur Δ1,2={132}; Δ1,3={123}; Δ1,4={1234}; Δ1,5={123465}; Δ1,6={123456} Δ2,1={231}; Δ2,3={213}; Δ2,4={2134}; Δ2,5={213465}; Δ2,6={213456} Δ3,1={321}; Δ3,2={312}; Δ3,4={34}; Δ3,5={3465}; Δ3,6={3456} Δ4,1={4321}; Δ4,2={4312}; Δ4,3={43}; Δ4,5={465}; Δ4,6={456} Δ5,1={564321}; Δ5,2={564312}; Δ5,3={5643}; Δ5,4={564}; Δ5,6={546} Δ6,1={654321}; Δ6,2={654312}; Δ6,3={6543}; Δ6,4={654}; Δ6,5={645}

Matrici şi indici

Se folosesc în studii matricile de Adiacenţă, Laplacian, Distanţă, Detur, Combinatoriale

C(D,2), C(Δ,2), Wiener, Szeged, Căi, Hosoya, Cluj, Distanţă-Extinse, Detur-Extinse, Reciproce,

Drum, Strat, Secvenţă, şi altele mai puţin frecvent.

Molecula reprezentată în următorul tabel (Tabelul 9) este folosită pentru ilustrarea matricilor

ce urmează:

Tabelul 9. Graful molecular supus analizei folosind matrici

5

1 23

46

7 89

1011 ÷ Secvenţa căilor terminale

o Şirul invariant al numărului de căi terminale: 0.0.0.8.12.6.8.8.8.8

o Şirul invariant al lungimii căilor terminale: 0.0.0.32.60.36.56.64.72.80

o Matricea de numărare a căilor terminale:

PTDS 1 2 3 4 5 6 7 8 9 10 Σ Π1 0 0 0 2 0 0 0 2 2 0 6 422 0 0 0 1 0 0 2 0 0 2 5 383 0 0 0 2 0 2 0 0 0 0 4 204 0 0 0 1 0 0 2 0 0 2 5 385 0 0 0 2 0 0 0 2 2 0 6 426 0 0 0 0 4 0 0 0 0 0 4 207 0 0 0 0 2 0 0 4 0 0 6 428 0 0 0 0 2 0 2 0 2 0 6 429 0 0 0 0 1 2 0 0 0 2 5 37

10 0 0 0 0 1 2 0 0 0 2 5 3711 0 0 0 0 2 0 2 0 2 0 6 42

÷ Secvenţa tuturor căilor

o Şirul invariant al numărului de căi: 12.15.19.23.22.18.16.12.8.4

o Şirul invariant al lungimii căilor: 12.30.57.92.110.108.112.96.72.40

o Matricea de numărare a căilor:

PADS 1 2 3 4 5 6 7 8 9 10 Σ Π 1 2 2 3 5 4 4 4 4 2 0 30 1572 2 3 4 4 3 4 4 2 2 2 30 1573 3 4 4 4 2 2 0 0 0 0 19 614 2 3 4 4 3 4 4 2 2 2 30 1575 2 2 3 5 4 4 4 4 2 0 30 1576 3 4 4 4 4 0 0 0 0 0 19 597 2 2 2 4 6 4 4 4 0 0 28 1428 2 2 3 4 5 4 4 2 2 0 28 1429 2 3 4 4 4 3 2 2 2 2 28 142

10 2 3 4 4 4 3 2 2 2 2 28 14211 2 2 3 4 5 4 4 2 2 0 28 142

÷ Secvenţa căilor distanţă

o Şirul invariant al numărului de căi distanţă: 12.15.14.10.8.4.0.0.0.0

o Şirul invariant al lungimii căilor distanţă: 12.30.42.40.40.24.0.0.0.0

o Matricea de numărare a căilor distanţă:

PDDS 1 2 3 4 5 6 7 8 9 10 Σ Π 1 2 2 1 2 2 2 0 0 0 0 11 392 2 3 2 2 2 0 0 0 0 0 11 323 3 4 2 2 0 0 0 0 0 0 11 254 2 3 2 2 2 0 0 0 0 0 11 325 2 2 1 2 2 2 0 0 0 0 11 396 3 4 4 0 0 0 0 0 0 0 11 237 2 2 2 2 4 4 0 0 0 0 16 648 2 2 3 2 2 0 0 0 0 0 11 339 2 3 4 2 0 0 0 0 0 0 11 28

10 2 3 4 2 0 0 0 0 0 0 11 2811 2 2 3 2 2 0 0 0 0 0 11 33

÷ Secvenţa căilor detur

o Şirul invariant al numărului de căi detur: 1.0.11.15.10.2.4.8.8.4

o Şirul invariant al lungimii căilor detur: 1.0.33.60.50.12.28.64.72.40

o Matricea de numărare a căilor detur:

PΔDS 1 2 3 4 5 6 7 8 9 10 Σ Π 1 0 0 2 3 0 0 2 2 2 0 11 66 2 0 0 2 2 1 0 0 2 2 2 11 73 3 1 0 2 4 2 2 0 0 0 0 11 45 4 0 0 2 2 1 0 0 2 2 2 11 73 5 0 0 2 3 0 0 2 2 2 0 11 66 6 1 0 2 4 4 0 0 0 0 0 11 43 7 0 0 2 4 2 0 4 4 0 0 16 92 8 0 0 2 2 3 0 0 2 2 0 11 63 9 0 0 2 2 2 1 0 0 2 2 11 68

10 0 0 2 2 2 1 0 0 2 2 11 68 11 0 0 2 2 3 0 0 2 2 0 11 63

÷ Secvenţa distanţelor

o Şirul invariant al distanţelor: 12.15.11.9.6.2.0.0.0.0

o Şirul invariant al lungimii distanţelor: 12.30.33.36.30.12.0.0.0.0

o Matricea de numărare a distanţelor:

MDDS 1 2 3 4 5 6 7 8 9 10 Σ Π 1 2 2 1 2 2 1 0 0 0 0 10 33 2 2 3 2 2 1 0 0 0 0 0 10 27 3 3 4 2 1 0 0 0 0 0 0 10 21 4 2 3 2 2 1 0 0 0 0 0 10 27 5 2 2 1 2 2 1 0 0 0 0 10 33 6 3 4 3 0 0 0 0 0 0 0 10 20 7 2 2 1 1 2 2 0 0 0 0 10 35 8 2 2 2 2 2 0 0 0 0 0 10 30 9 2 3 3 2 0 0 0 0 0 0 10 25

10 2 3 3 2 0 0 0 0 0 0 10 25 11 2 2 2 2 2 0 0 0 0 0 10 30

÷ Secvenţa detururilor

o Şirul invariant al detururilor: 1.0.8.14.10.2.2.6.8.4

o Şirul invariant al lungimii detururilor: 1.0.24.56.50.12.14.48.72.40

o Matricea de numărare a detururilor:

MΔDS 1 2 3 4 5 6 7 8 9 10 Σ Π 1 0 0 2 3 0 0 1 2 2 0 10 59 2 0 0 2 2 1 0 0 1 2 2 10 65 3 1 0 2 3 2 2 0 0 0 0 10 41 4 0 0 2 2 1 0 0 1 2 2 10 65 5 0 0 2 3 0 0 1 2 2 0 10 59 6 1 0 1 4 4 0 0 0 0 0 10 40 7 0 0 1 3 2 0 2 2 0 0 10 55 8 0 0 1 2 3 0 0 2 2 0 10 60

9 0 0 1 2 2 1 0 0 2 2 10 65 10 0 0 1 2 2 1 0 0 2 2 10 65 11 0 0 1 2 3 0 0 2 2 0 10 60

÷ Adiacenţe:

o Σ(·): 12;

o Σ(·)2: 12;

o ΣA(·): 12;

o ΣA(·)2: 12;

o Matricea:

Ad 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 1 0 0 1 0 0 0 0 0 0 22 1 0 1 0 0 0 0 0 0 0 0 23 0 1 0 1 0 1 0 0 0 0 0 34 0 0 1 0 1 0 0 0 0 0 0 25 1 0 0 1 0 0 0 0 0 0 0 26 0 0 1 0 0 0 0 0 1 1 0 37 0 0 0 0 0 0 0 1 0 0 1 28 0 0 0 0 0 0 1 0 1 0 0 29 0 0 0 0 0 1 0 1 0 0 0 2

10 0 0 0 0 0 1 0 0 0 0 1 211 0 0 0 0 0 0 1 0 0 1 0 2Σ 2 2 3 2 2 3 2 2 2 2 2 24

÷ Distanţe:

o Σ(·): 153;

o Σ(·)2: 537;

o ΣA(·): 12;

o ΣA(·)2: 12;

o Matricea:

Di 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 1 2 2 1 3 6 5 4 4 5 332 1 0 1 2 2 2 5 4 3 3 4 273 2 1 0 1 2 1 4 3 2 2 3 214 2 2 1 0 1 2 5 4 3 3 4 275 1 2 2 1 0 3 6 5 4 4 5 336 3 2 1 2 3 0 3 2 1 1 2 207 6 5 4 5 6 3 0 1 2 2 1 358 5 4 3 4 5 2 1 0 1 3 2 309 4 3 2 3 4 1 2 1 0 2 3 25

10 4 3 2 3 4 1 2 3 2 0 1 2511 5 4 3 4 5 2 1 2 3 1 0 30Σ 33 27 21 27 33 20 35 30 25 25 30 306

÷ Reciproce de Distanţe:

o Σ(·): 26.95;

o Σ(·)2: 17.8302(7);

o ΣA(·): 12;

o ΣA(·)2: 12;

o Matricea:

RDi 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 1.000 0.500 0.500 1.000 0.333 0.167 0.200 0.250 0.250 0.200 4.4002 1.000 0.000 1.000 0.500 0.500 0.500 0.200 0.250 0.333 0.333 0.250 4.8673 0.500 1.000 0.000 1.000 0.500 1.000 0.250 0.333 0.500 0.500 0.333 5.9174 0.500 0.500 1.000 0.000 1.000 0.500 0.200 0.250 0.333 0.333 0.250 4.8675 1.000 0.500 0.500 1.000 0.000 0.333 0.167 0.200 0.250 0.250 0.200 4.4006 0.333 0.500 1.000 0.500 0.333 0.000 0.333 0.500 1.000 1.000 0.500 6.0007 0.167 0.200 0.250 0.200 0.167 0.333 0.000 1.000 0.500 0.500 1.000 4.3178 0.200 0.250 0.333 0.250 0.200 0.500 1.000 0.000 1.000 0.333 0.500 4.5679 0.250 0.333 0.500 0.333 0.250 1.000 0.500 1.000 0.000 0.500 0.333 5.000

10 0.250 0.333 0.500 0.333 0.250 1.000 0.500 0.333 0.500 0.000 1.000 5.00011 0.200 0.250 0.333 0.250 0.200 0.500 1.000 0.500 0.333 1.000 0.000 4.567Σ 4.400 4.867 5.917 4.867 4.400 6.000 4.317 4.567 5.000 5.000 4.567 53.900

÷ Detururi:

o Σ(·): 317;

o Σ(·)2: 2149;

o ΣA(·): 51;

o ΣA(·)2: 231;

o Matricea:

De 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 4 3 3 4 4 7 8 9 9 8 592 4 0 4 3 3 5 8 9 10 10 9 653 3 4 0 4 3 1 4 5 6 6 5 414 3 3 4 0 4 5 8 9 10 10 9 655 4 3 3 4 0 4 7 8 9 9 8 596 4 5 1 5 4 0 3 4 5 5 4 407 7 8 4 8 7 3 0 5 4 4 5 558 8 9 5 9 8 4 5 0 5 3 4 609 9 10 6 10 9 5 4 5 0 4 3 65

10 9 10 6 10 9 5 4 3 4 0 5 6511 8 9 5 9 8 4 5 4 3 5 0 60Σ 59 65 41 65 59 40 55 60 65 65 60 634

÷ Reciproce de Detururi:

o Σ(·): 11.8246031746;

o Σ(·)2: 3.4927762031;

o ΣA(·): 3.45;

o ΣA(·)2: 1.5525;

o Matricea:

RDe 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 0.250 0.333 0.333 0.250 0.250 0.143 0.125 0.111 0.111 0.125 2.0322 0.250 0.000 0.250 0.333 0.333 0.200 0.125 0.111 0.100 0.100 0.111 1.914

3 0.333 0.250 0.000 0.250 0.333 1.000 0.250 0.200 0.167 0.167 0.200 3.1504 0.333 0.333 0.250 0.000 0.250 0.200 0.125 0.111 0.100 0.100 0.111 1.9145 0.250 0.333 0.333 0.250 0.000 0.250 0.143 0.125 0.111 0.111 0.125 2.0326 0.250 0.200 1.000 0.200 0.250 0.000 0.333 0.250 0.200 0.200 0.250 3.1337 0.143 0.125 0.250 0.125 0.143 0.333 0.000 0.200 0.250 0.250 0.200 2.0198 0.125 0.111 0.200 0.111 0.125 0.250 0.200 0.000 0.200 0.333 0.250 1.9069 0.111 0.100 0.167 0.100 0.111 0.200 0.250 0.200 0.000 0.250 0.333 1.822

10 0.111 0.100 0.167 0.100 0.111 0.200 0.250 0.333 0.250 0.000 0.200 1.82211 0.125 0.111 0.200 0.111 0.125 0.250 0.200 0.250 0.333 0.200 0.000 1.906Σ 2.032 1.914 3.150 1.914 2.032 3.133 2.019 1.906 1.822 1.822 1.906 23.649

÷ Matricea Cluj pe Distanţe, CJD:

o Definiţie: CJDi,j = max|CJDSi,j|; {k}∈CJDSi,j ⇔ d(G)k,i<d(G)k,j şi ∃p∈D(G)i,j,

∃q∈D(G)k,i: p∩q={i};

o Referinţe:

÷ Diudea MV. 1997. Cluj Matrix, CJu: Source of Various Graph Descriptors.

Commun Math Comput Chem 35:169-183.

÷ Jäntschi L. 2002. Graph Theory. 1. Fragmentation of Structural Graphs.

Leonardo El J Pract Technol 1(1):19-36.

o Enumerarea seturilor CJDS:

(i,j) p∈D(G)i,j CJDSi,j (1, 2) [1, 2] {1, 5} (2, 1) [2,1] {2, 3, 6, 7, 8, 9, 10, 11} (1, 3) [1, 2, 3] {1, 5} (3, 1) [3, 2, 1] {3, 4, 6, 7, 8, 9, 10, 11} (1, 4) [1, 5, 4] {1, 2} (4, 1) [4, 5, 1] {3, 4, 6, 7, 8, 9, 10, 11} (1, 5) [1, 5] {1, 2} (5, 1) [5, 1] {4, 5} (1, 6) [1, 2, 3, 6] {1, 5} (6, 1) [6, 3, 2, 1] {6, 7, 8, 9, 10, 11} (1, 7) [1, 2, 3, 6, 9, 8, 7] {1, 4, 5} (1, 7) [1, 2, 3, 6, 10, 11, 7] {1, 4, 5} (7, 1) [7, 8, 9, 6, 3, 2, 1] {7, 10, 11} (7, 1) [7, 11, 10, 6, 3, 2, 1] {7, 8, 9} (1, 8) [1, 2, 3, 6, 9, 8] {1, 4, 5} (8, 1) [8, 9, 6, 3, 2, 1] {7, 8, 10, 11} (1, 9) [1, 2, 3, 6, 9] {1, 4, 5} (9, 1) [9, 6, 3, 2, 1] {7, 8, 9, 10, 11} (1, 10) [1, 2, 3, 6, 10] {1, 4, 5} (10, 1) [10, 6, 3, 2, 1] {7, 8, 9, 10, 11} (1, 11) [1, 2, 3, 6, 10, 11] {1, 4, 5} (11, 1) [11, 10, 6, 3, 2, 1] {7, 8, 9, 11} (2, 3) [2, 3] {1, 2} (3, 2) [3, 2] {3, 4, 6, 7, 8, 9, 10, 11} (2, 4) [2, 3, 4] {1, 2} (4, 2) [4, 3, 2] {4, 5}

(2, 5) [2, 1, 5] {2, 3, 6, 7, 8, 9, 10, 11} (5, 2) [5, 1, 2] {4, 5} (2, 6) [2, 3, 6] {1, 2, 5} (6, 2) [6, 3, 2] {6, 7, 8, 9, 10, 11} (2, 7) [2, 3, 6, 9, 8, 7] {1, 2, 4, 5} (2, 7) [2, 3, 6, 10, 11, 7] {1, 2, 4, 5} (7, 2) [7, 8, 9, 6, 3, 2] {7, 10, 11} (7, 2) [7, 11, 10, 6, 3, 2] {7, 8, 9} (2, 8) [2, 3, 6, 9, 8] {1, 2, 4, 5} (8, 2) [8, 9, 6, 3, 2] {7, 8, 11} (2, 9) [2, 3, 6, 9] {1, 2, 4, 5} (9, 2) [9, 6, 3, 2] {7, 8, 9, 10, 11} (2, 10) [2, 3, 6, 10] {1, 2, 4, 5} (10, 2) [10, 6, 3, 2] {7, 8, 9, 10, 11} (2, 11) [2, 3, 6, 10, 11] {1, 2, 4, 5} (11, 2) [11, 10, 6, 3, 2] {7, 8, 11} (3, 4) [3, 4] {2, 3, 6, 7, 8, 9, 10, 11} (4, 3) [4, 3] {4, 5} (3, 5) [3, 4, 5] {2, 3, 6, 7, 8, 9, 10, 11} (5, 3) [5, 4, 3] {1, 5} (3, 6) [3, 6] {1, 2, 3, 4, 5} (6, 3) [6, 3] {6, 7, 8, 9, 10, 11} (3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5} (3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5} (7, 3) [7, 8, 9, 6, 3] {7, 11} (7, 3) [7, 11, 10, 6, 3] {7, 8} (3, 8) [3, 6, 9, 8] {1, 2, 3, 4, 5} (8, 3) [8, 9, 6, 3] {7, 8, 11} (3, 9) [3, 6, 9] {1, 2, 3, 4, 5} (9, 3) [9, 6, 3] {7, 8, 9} (3, 10) [3, 6, 10] {1, 2, 3, 4, 5} (10, 3) [10, 6, 3] {7, 10, 11} (3, 11) [3, 6, 10, 11] {1, 2, 3, 4, 5} (11, 3) [11, 10, 6, 3] {7, 8, 11} (4, 5) [4, 5] {3, 4, 6, 7, 8, 9, 10, 11} (5, 4) [5, 4] {1, 5} (4, 6) [4, 3, 6] {1, 4, 5} (6, 4) [6, 3, 4] {6, 7, 8, 9, 10, 11} (4, 7) [4, 3, 6, 9, 8, 7] {1, 2, 4, 5} (4, 7) [4, 3, 6, 10, 11, 7] {1, 2, 4, 5} (7, 4) [7, 8, 9, 6, 3, 4] {7, 10, 11} (7, 4) [7, 11, 10, 6, 3, 4] {7, 8, 9} (4, 8) [4, 3, 6, 9, 8] {1, 2, 4, 5} (8, 4) [8, 9, 6, 3, 4] {7, 8, 11} (4, 9) [4, 3, 6, 9] {1, 2, 4, 5} (9, 4) [9, 6, 3, 4] {7, 8, 9, 10, 11} (4, 10) [4, 3, 6, 10] {1, 2, 4, 5} (10, 4) [10, 6, 3, 4] {7, 8, 9, 10, 11} (4, 11) [4, 3, 6, 10, 11] {1, 2, 4, 5} (11, 4) [11, 10, 6, 3, 4] {7, 8, 11}

(5, 6) [5, 4, 3, 6] {1, 5} (6, 5) [6, 3, 4, 5] {6, 7, 8, 9, 10, 11} (5, 7) [5, 4, 3, 6, 9, 8, 7] {1, 2, 5} (5, 7) [5, 4, 3, 6, 10, 11, 7] {1, 2, 5} (7, 5) [7, 8, 9, 6, 3, 4, 5] {7, 10, 11} (7, 5) [7, 11, 10, 6, 3, 4, 5] {7, 8, 9} (5, 8) [5, 4, 3, 6, 9, 8] {1, 2, 5} (8, 5) [8, 9, 6, 3, 4, 5] {7, 8, 10, 11} (5, 9) [5, 4, 3, 6, 9] {1, 2, 5} (9, 5) [9, 6, 3, 4, 5] {7, 8, 9, 10, 11} (5, 10) [5, 4, 3, 6, 10] {1, 2, 5} (10, 5) [10, 6, 3, 4, 5] {7, 8, 9, 10, 11} (5, 11) [5, 4, 3, 6, 10, 11] {1, 2, 5} (11, 5) [11, 10, 6, 3, 4, 5] {7, 8, 9, 11} (6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9} (6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10} (7, 6) [7, 8, 9, 6] {7, 11} (7, 6) [7, 11, 10, 6] {7, 8} (6, 8) [6, 9, 8] {1, 2, 3, 4, 5, 6, 10} (8, 6) [8, 9, 6] {7, 8} (6, 9) [6, 9] {1, 2, 3, 4, 5, 6, 10, 11} (9, 6) [9, 6] {7, 8, 9} (6, 10) [6, 10] {1, 2, 3, 4, 5, 6, 8, 9} (10, 6) [10, 6] {7, 10, 11} (6, 11) [6, 10, 11] {1, 2, 3, 4, 5, 6, 9} (11, 6) [11, 10, 6] {7, 11} (7, 8) [7, 8] {7, 10, 11} (8, 7) [8, 7] {1, 2, 3, 4, 5, 6, 8, 9} (7, 9) [7, 8, 9] {7, 11} (9, 7) [9, 8, 7] {1, 2, 3, 4, 5, 6, 9} (7, 10) [7, 11, 10] {7, 8} (10, 7) [10, 11, 7] {1, 2, 3, 4, 5, 6, 10} (7, 11) [7, 11] {7, 8, 9} (11, 7) [11, 7] {1, 2, 3, 4, 5, 6, 10, 11} (8, 9) [8, 9] {7, 8, 11} (9, 8) [9, 8] {1, 2, 3, 4, 5, 6, 9, 10} (8, 10) [8, 9, 6, 10] {7, 8} (8, 10) [8, 7, 11, 10] {8, 9} (10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10} (8, 11) [8, 7, 11] {8, 9} (11, 8) [11, 7, 8] {10, 11} (9, 10) [9, 6, 10] {8, 9} (10, 9) [10, 6, 9] {10, 11} (9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9} (11, 9) [11, 10, 6, 9] {7, 11} (11, 9) [11, 7, 8, 9] {10, 11} (10, 11) [10, 11] {1, 2, 3, 4, 5, 6, 9, 10} (11, 10) [11, 10] {7, 8, 11}

o Σ(CJD): 229.5;

o Σ(CJD)2: 824;

o ΣA(CJD): 60.5;

o ΣA(CJD)2: 242;

o Matricea CJD:

CJD 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 2 2 2 2 2 3 3 3 3 3 252 8 0 2 2 8 3 4 4 4 4 4 433 8 8 0 8 8 5 5 5 5 5 5 624 8 2 2 0 8 3 4 4 4 4 4 435 2 2 2 2 0 2 3 3 3 3 3 256 6 6 6 6 6 0 7 7 8 8 7 677 3 3 2 3 3 2 0 3 2 2 3 268 4 3 3 3 4 2 8 0 3 2 2 349 5 5 3 5 5 3 7 8 0 2 7 50

10 5 5 3 5 5 3 7 7 2 0 8 5011 4 3 3 3 4 2 8 2 2 3 0 34Σ 53 39 28 39 53 27 56 46 36 36 46 459

o Σ(RCJD): 16.441(6);

o Σ(RCJD)2: 4.45;

o ΣA(RCJD): 3.308(3);

o ΣA(RCJD)2: 0.78(3);

o Matricea RCJD:

RCJD 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 0.500 0.500 0.500 0.500 0.500 0.333 0.333 0.333 0.333 0.333 4.1672 0.125 0.000 0.500 0.500 0.125 0.333 0.250 0.250 0.250 0.250 0.250 2.8333 0.125 0.125 0.000 0.125 0.125 0.200 0.200 0.200 0.200 0.200 0.200 1.7004 0.125 0.500 0.500 0.000 0.125 0.333 0.250 0.250 0.250 0.250 0.250 2.8335 0.500 0.500 0.500 0.500 0.000 0.500 0.333 0.333 0.333 0.333 0.333 4.1676 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.143 0.125 0.125 0.143 1.5127 0.333 0.333 0.500 0.333 0.333 0.500 0.000 0.333 0.500 0.500 0.333 4.0008 0.250 0.333 0.333 0.333 0.250 0.500 0.125 0.000 0.333 0.500 0.500 3.4589 0.200 0.200 0.333 0.200 0.200 0.333 0.143 0.125 0.000 0.500 0.143 2.377

10 0.200 0.200 0.333 0.200 0.200 0.333 0.143 0.143 0.500 0.000 0.125 2.37711 0.250 0.333 0.333 0.333 0.250 0.500 0.125 0.500 0.500 0.333 0.000 3.458Σ 2.275 3.192 4.000 3.192 2.275 4.033 2.045 2.611 3.325 3.325 2.611 32.883

÷ Matricea Cluj pe Detururi, CJΔ:

o Definiţie: CJΔi,j = max|CJΔSi,j|; {k}∈CJΔSi,j ⇔ d(G)k,i<d(G)k,j şi ∃p∈Δ(G)i,j,

∃q∈D(G)k,i: p∩q={i};

o Referinţe:

÷ Diudea MV, Pârv B, Gutman I. 1997. Detour-Cluj Matrix and Derived

Invariants. J Chem Inf Comput Sci 37(6):1101-1108.

÷ Jäntschi L. 2002. Graph Theory. 1. Fragmentation of Structural Graphs.

Leonardo El J Pract Technol 1(1):19-36.

o Enumerarea seturilor CJΔS:

(i,j) p∈Δ(G)i,j CJΔSi,j (1, 2) [1, 5, 4, 3, 2] {1} (2, 1) [2, 3, 4, 5, 1] {2} (1, 3) [1, 5, 4, 3] {1} (3, 1) [3, 4, 5, 1] {3, 6, 7, 8, 9, 10, 11} (1, 4) [1, 2, 3, 4] {1} (4, 1) [4, 3, 2, 1] {4} (1, 5) [1, 2, 3, 4, 5] {1} (5, 1) [5, 4, 3, 2, 1] {5} (1, 6) [1, 5, 4, 3, 6] {1, 2} (6, 1) [6, 3, 4, 5, 1] {6, 7, 8, 9, 10, 11} (1, 7) [1, 5, 4, 3, 6, 10, 11, 7] {1, 2} (1, 7) [1, 5, 4, 3, 6, 9, 8, 7] {1, 2} (7, 1) [7, 8, 9, 6, 3, 4, 5, 1] {7, 10, 11} (7, 1) [7, 11, 10, 6, 3, 4, 5, 1] {7, 8, 9} (1, 8) [1, 5, 4, 3, 6, 10, 11, 7, 8] {1, 2} (8, 1) [8, 7, 11, 10, 6, 3, 4, 5, 1] {8, 9} (1, 9) [1, 5, 4, 3, 6, 10, 11, 7, 8, 9] {1, 2} (9, 1) [9, 8, 7, 11, 10, 6, 3, 4, 5, 1] {9} (1, 10) [1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {1, 2} (10, 1) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1] {10} (1, 11) [1, 5, 4, 3, 6, 9, 8, 7, 11] {1, 2} (11, 1) [11, 7, 8, 9, 6, 3, 4, 5, 1] {10, 11} (2, 3) [2, 1, 5, 4, 3] {2} (3, 2) [3, 4, 5, 1, 2] {3, 6, 7, 8, 9, 10, 11} (2, 4) [2, 1, 5, 4] {2} (4, 2) [4, 5, 1, 2] {4} (2, 5) [2, 3, 4, 5] {2} (5, 2) [5, 4, 3, 2] {5} (2, 6) [2, 1, 5, 4, 3, 6] {2} (6, 2) [6, 3, 4, 5, 1, 2] {6, 7, 8, 9, 10, 11} (2, 7) [2, 1, 5, 4, 3, 6, 10, 11, 7] {2} (2, 7) [2, 1, 5, 4, 3, 6, 9, 8, 7] {2} (7, 2) [7, 8, 9, 6, 3, 4, 5, 1, 2] {7, 10, 11} (7, 2) [7, 11, 10, 6, 3, 4, 5, 1, 2] {7, 8, 9} (2, 8) [2, 1, 5, 4, 3, 6, 10, 11, 7, 8] {2} (8, 2) [8, 7, 11, 10, 6, 3, 4, 5, 1, 2] {8, 9} (2, 9) [2, 1, 5, 4, 3, 6, 10, 11, 7, 8, 9] {2} (9, 2) [9, 8, 7, 11, 10, 6, 3, 4, 5, 1, 2] {9} (2, 10) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {2} (10, 2) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10} (2, 11) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11] {2} (11, 2) [11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10, 11} (3, 4) [3, 2, 1, 5, 4] {3, 6, 7, 8, 9, 10, 11} (4, 3) [4, 5, 1, 2, 3] {4} (3, 5) [3, 2, 1, 5] {3, 6, 7, 8, 9, 10, 11} (5, 3) [5, 1, 2, 3] {5} (3, 6) [3, 6] {1, 2, 3, 4, 5} (6, 3) [6, 3] {6, 7, 8, 9, 10, 11} (3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5}

(3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5} (7, 3) [7, 8, 9, 6, 3] {7, 11} (7, 3) [7, 11, 10, 6, 3] {7, 8} (3, 8) [3, 6, 10, 11, 7, 8] {1, 2, 3, 4, 5} (8, 3) [8, 7, 11, 10, 6, 3] {8, 9} (3, 9) [3, 6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5} (9, 3) [9, 8, 7, 11, 10, 6, 3] {9} (3, 10) [3, 6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5} (10, 3) [10, 11, 7, 8, 9, 6, 3] {10} (3, 11) [3, 6, 9, 8, 7, 11] {1, 2, 3, 4, 5} (11, 3) [11, 7, 8, 9, 6, 3] {10, 11} (4, 5) [4, 3, 2, 1, 5] {4} (5, 4) [5, 1, 2, 3, 4] {5} (4, 6) [4, 5, 1, 2, 3, 6] {4} (6, 4) [6, 3, 2, 1, 5, 4] {6, 7, 8, 9, 10, 11} (4, 7) [4, 5, 1, 2, 3, 6, 10, 11, 7] {4} (4, 7) [4, 5, 1, 2, 3, 6, 9, 8, 7] {4} (7, 4) [7, 8, 9, 6, 3, 2, 1, 5, 4] {7, 10, 11} (7, 4) [7, 11, 10, 6, 3, 2, 1, 5, 4] {7, 8, 9} (4, 8) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8] {4} (8, 4) [8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {8, 9} (4, 9) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4} (9, 4) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {9} (4, 10) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4} (10, 4) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10} (4, 11) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11] {4} (11, 4) [11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10, 11} (5, 6) [5, 1, 2, 3, 6] {4, 5} (6, 5) [6, 3, 2, 1, 5] {6, 7, 8, 9, 10, 11} (5, 7) [5, 1, 2, 3, 6, 10, 11, 7] {4, 5} (5, 7) [5, 1, 2, 3, 6, 9, 8, 7] {4, 5} (7, 5) [7, 8, 9, 6, 3, 2, 1, 5] {7, 10, 11} (7, 5) [7, 11, 10, 6, 3, 2, 1, 5] {7, 8, 9} (5, 8) [5, 1, 2, 3, 6, 10, 11, 7, 8] {4, 5} (8, 5) [8, 7, 11, 10, 6, 3, 2, 1, 5] {8, 9} (5, 9) [5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4, 5} (9, 5) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5] {9} (5, 10) [5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4, 5} (10, 5) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5] {10} (5, 11) [5, 1, 2, 3, 6, 9, 8, 7, 11] {4, 5} (11, 5) [11, 7, 8, 9, 6, 3, 2, 1, 5] {10, 11} (6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9} (6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10} (7, 6) [7, 8, 9, 6] {7, 11} (7, 6) [7, 11, 10, 6] {7, 8} (6, 8) [6, 10, 11, 7, 8] {1, 2, 3, 4, 5, 6} (8, 6) [8, 7, 11, 10, 6] {8} (6, 9) [6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5, 6} (9, 6) [9, 8, 7, 11, 10, 6] {9} (6, 10) [6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5, 6}

(10, 6) [10, 11, 7, 8, 9, 6] {10} (6, 11) [6, 9, 8, 7, 11] {1, 2, 3, 4, 5, 6} (11, 6) [11, 7, 8, 9, 6] {11} (7, 8) [7, 11, 10, 6, 9, 8] {7} (8, 7) [8, 9, 6, 10, 11, 7] {8} (7, 9) [7, 11, 10, 6, 9] {7} (9, 7) [9, 6, 10, 11, 7] {9} (7, 10) [7, 8, 9, 6, 10] {7} (10, 7) [10, 6, 9, 8, 7] {10} (7, 11) [7, 8, 9, 6, 10, 11] {7} (11, 7) [11, 10, 6, 9, 8, 7] {11} (8, 9) [8, 7, 11, 10, 6, 9] {8} (9, 8) [9, 6, 10, 11, 7, 8] {9} (8, 10) [8, 9, 6, 10] {7, 8} (8, 10) [8, 7, 11, 10] {8, 9} (10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10} (8, 11) [8, 9, 6, 10, 11] {8} (11, 8) [11, 10, 6, 9, 8] {11} (9, 10) [9, 8, 7, 11, 10] {9} (10, 9) [10, 11, 7, 8, 9] {10} (9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9} (11, 9) [11, 10, 6, 9] {7, 11} (11, 9) [11, 7, 8, 9] {10, 11} (10, 11) [10, 6, 9, 8, 7, 11] {10} (11, 10) [11, 7, 8, 9, 6, 10] {11}

o Σ(CJΔ): 127.5;

o Σ(CJΔ)2: 268;

o ΣA(CJΔ): 27.5;

o ΣA(CJΔ)2: 63;

o Matricea CJΔ:

CJΔ 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 1 1 1 1 2 2 2 2 2 2 162 1 0 1 1 1 1 1 1 1 1 1 103 7 7 0 7 7 5 5 5 5 5 5 584 1 1 1 0 1 1 1 1 1 1 1 105 1 1 1 1 0 2 2 2 2 2 2 166 6 6 6 6 6 0 7 6 6 6 6 617 3 3 2 3 3 2 0 1 1 1 1 208 2 2 2 2 2 1 1 0 1 2 1 169 1 1 1 1 1 1 1 1 0 1 7 16

10 1 1 1 1 1 1 1 7 1 0 1 1611 2 2 2 2 2 1 1 1 2 1 0 16Σ 25 25 18 25 25 17 22 27 22 22 27 255

o Σ(RCJΔ): 38.01(6);

o Σ(RCJΔ)2: 26.6857;

o ΣA(RCJΔ): 9.492857;

o ΣA(RCJΔ)2: 7.6523809;

o Matricea RCJΔ:

RCJΔ 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 1.000 1.000 1.000 1.000 0.500 0.500 0.500 0.500 0.500 0.500 7.0002 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.0003 0.143 0.143 0.000 0.143 0.143 0.200 0.200 0.200 0.200 0.200 0.200 1.7714 1.000 1.000 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.0005 1.000 1.000 1.000 1.000 0.000 0.500 0.500 0.500 0.500 0.500 0.500 7.0006 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.167 0.167 0.167 0.167 1.6437 0.333 0.333 0.500 0.333 0.333 0.500 0.000 1.000 1.000 1.000 1.000 6.3338 0.500 0.500 0.500 0.500 0.500 1.000 1.000 0.000 1.000 0.500 1.000 7.0009 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.000 1.000 0.143 9.143

10 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.143 1.000 0.000 1.000 9.14311 0.500 0.500 0.500 0.500 0.500 1.000 1.000 1.000 0.500 1.000 0.000 7.000Σ 6.643 6.643 7.667 6.643 6.643 7.700 7.343 6.510 6.867 6.867 6.510 76.033

÷ Matricea Cluj Fragmental pe Distanţe, CFD:

o Definiţie: CFDi,j = max|CFDSi,j|; {k}∈CFDSi,j ⇔ d(Gp)k,i<d(Gp)k,j | p∈D(G)i,j, Gp=G\p;

o Referinţe:

÷ Jäntschi L, Katona G, Diudea MV. 2000. Modeling Molecular Properties by Cluj

Indices. Commun Math Comput Chem 41:151-188.

÷ Jäntschi L. 2002. Graph Theory. 1. Fragmentation of Structural Graphs.

Leonardo El J Pract Technol 1(1):19-36.

o Enumerarea seturilor CFDS:

(i,j) p∈D(G)i,j CFDSi,j (1, 2) [1, 2] {1, 5} (2, 1) [2, 1] {2, 3, 6, 7, 8, 9, 10, 11} (1, 3) [1, 2, 3] {1, 5} (3, 1) [3, 2, 1] {3, 4, 6, 7, 8, 9, 10, 11} (1, 4) [1, 5, 4] {1, 2} (4, 1) [4, 5, 1] {3, 4, 6, 7, 8, 9, 10, 11} (1, 5) [1, 5] {1, 2} (5, 1) [5, 1] {4, 5} (1, 6) [1, 2, 3, 6] {1, 4, 5} (6, 1) [6, 3, 2, 1] {6, 7, 8, 9, 10, 11} (1, 7) [1, 2, 3, 6, 9, 8, 7] {1, 4, 5} (7, 1) [7, 8, 9, 6, 3, 2, 1] {7, 10, 11} (1, 7) [1, 2, 3, 6, 10, 11, 7] {1, 4, 5} (7, 1) [7, 11, 10, 6, 3, 2, 1] {7, 8, 9} (1, 8) [1, 2, 3, 6, 9, 8] {1, 4, 5} (8, 1) [8, 9, 6, 3, 2, 1] {7, 8, 10, 11} (1, 9) [1, 2, 3, 6, 9] {1, 4, 5} (9, 1) [9, 6, 3, 2, 1] {7, 8, 9, 10, 11} (1, 10) [1, 2, 3, 6, 10] {1, 4, 5} (10, 1) [10, 6, 3, 2, 1] {7, 8, 9, 10, 11} (1, 11) [1, 2, 3, 6, 10, 11] {1, 4, 5} (11, 1) [11, 10, 6, 3, 2, 1] {7, 8, 9, 11} (2, 3) [2, 3] {1, 2}

(3, 2) [3, 2] {3, 4, 6, 7, 8, 9, 10, 11} (2, 4) [2, 3, 4] {1, 2} (4, 2) [4, 3, 2] {4, 5} (2, 5) [2, 1, 5] {2, 3, 6, 7, 8, 9, 10, 11} (5, 2) [5, 1, 2] {4, 5} (2, 6) [2, 3, 6] {1, 2, 4, 5} (6, 2) [6, 3, 2] {6, 7, 8, 9, 10, 11} (2, 7) [2, 3, 6, 9, 8, 7] {1, 2, 4, 5} (7, 2) [7, 8, 9, 6, 3, 2] {7, 10, 11} (2, 7) [2, 3, 6, 10, 11, 7] {1, 2, 4, 5} (7, 2) [7, 11, 10, 6, 3, 2] {7, 8, 9} (2, 8) [2, 3, 6, 9, 8] {1, 2, 4, 5} (8, 2) [8, 9, 6, 3, 2] {7, 8, 10, 11} (2, 9) [2, 3, 6, 9] {1, 2, 4, 5} (9, 2) [9, 6, 3, 2] {7, 8, 9, 10, 11} (2, 10) [2, 3, 6, 10] {1, 2, 4, 5} (10, 2) [10, 6, 3, 2] {7, 8, 9, 10, 11} (2, 11) [2, 3, 6, 10, 11] {1, 2, 4, 5} (11, 2) [11, 10, 6, 3, 2] {7, 8, 9, 11} (3, 4) [3, 4] {2, 3, 6, 7, 8, 9, 10, 11} (4, 3) [4, 3] {4, 5} (3, 5) [3, 4, 5] {2, 3, 6, 7, 8, 9, 10, 11} (5, 3) [5, 4, 3] {1, 5} (3, 6) [3, 6] {1, 2, 3, 4, 5} (6, 3) [6, 3] {6, 7, 8, 9, 10, 11} (3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5} (7, 3) [7, 11, 10, 6, 3] {7, 8, 9} (3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5} (7, 3) [7, 8, 9, 6, 3] {7, 10, 11} (3, 8) [3, 6, 9, 8] {1, 2, 3, 4, 5} (8, 3) [8, 9, 6, 3] {7, 8, 10, 11} (3, 9) [3, 6, 9] {1, 2, 3, 4, 5} (9, 3) [9, 6, 3] {7, 8, 9, 10, 11} (3, 10) [3, 6, 10] {1, 2, 3, 4, 5} (10, 3) [10, 6, 3] {7, 8, 9, 10, 11} (3, 11) [3, 6, 10, 11] {1, 2, 3, 4, 5} (11, 3) [11, 10, 6, 3] {7, 8, 9, 11} (4, 5) [4, 5] {3, 4, 6, 7, 8, 9, 10, 11} (5, 4) [5, 4] {1, 5} (4, 6) [4, 3, 6] {1, 2, 4, 5} (6, 4) [6, 3, 4] {6, 7, 8, 9, 10, 11} (4, 7) [4, 3, 6, 9, 8, 7] {1, 2, 4, 5} (7, 4) [7, 8, 9, 6, 3, 4] {7, 10, 11} (4, 7) [4, 3, 6, 10, 11, 7] {1, 2, 4, 5} (7, 4) [7, 11, 10, 6, 3, 4] {7, 8, 9} (4, 8) [4, 3, 6, 9, 8] {1, 2, 4, 5} (8, 4) [8, 9, 6, 3, 4] {7, 8, 10, 11} (4, 9) [4, 3, 6, 9] {1, 2, 4, 5} (9, 4) [9, 6, 3, 4] {7, 8, 9, 10, 11} (4, 10) [4, 3, 6, 10] {1, 2, 4, 5}

(10, 4) [10, 6, 3, 4] {7, 8, 9, 10, 11} (4, 11) [4, 3, 6, 10, 11] {1, 2, 4, 5} (11, 4) [11, 10, 6, 3, 4] {7, 8, 9, 11} (5, 6) [5, 4, 3, 6] {1, 2, 5} (6, 5) [6, 3, 4, 5] {6, 7, 8, 9, 10, 11} (5, 7) [5, 4, 3, 6, 9, 8, 7] {1, 2, 5} (7, 5) [7, 8, 9, 6, 3, 4, 5] {7, 10, 11} (5, 7) [5, 4, 3, 6, 10, 11, 7] {1, 2, 5} (7, 5) [7, 11, 10, 6, 3, 4, 5] {7, 8, 9} (5, 8) [5, 4, 3, 6, 9, 8] {1, 2, 5} (8, 5) [8, 9, 6, 3, 4, 5] {7, 8, 10, 11} (5, 9) [5, 4, 3, 6, 9] {1, 2, 5} (9, 5) [9, 6, 3, 4, 5] {7, 8, 9, 10, 11} (5, 10) [5, 4, 3, 6, 10] {1, 2, 5} (10, 5) [10, 6, 3, 4, 5] {7, 8, 9, 10, 11} (5, 11) [5, 4, 3, 6, 10, 11] {1, 2, 5} (11, 5) [11, 10, 6, 3, 4, 5] {7, 8, 9, 11} (6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9} (7, 6) [7, 11, 10, 6] {7, 8} (6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10} (7, 6) [7, 8, 9, 6] {7, 11} (6, 8) [6, 9, 8] {1, 2, 3, 4, 5, 6, 10} (8, 6) [8, 9, 6] {7, 8} (6, 9) [6, 9] {1, 2, 3, 4, 5, 6, 10, 11} (9, 6) [9, 6] {7, 8, 9} (6, 10) [6, 10] {1, 2, 3, 4, 5, 6, 8, 9} (10, 6) [10, 6] {7, 10, 11} (6, 11) [6, 10, 11] {1, 2, 3, 4, 5, 6, 9} (11, 6) [11, 10, 6] {7, 11} (7, 8) [7, 8] {7, 10, 11} (8, 7) [8, 7] {1, 2, 3, 4, 5, 6, 8, 9} (7, 9) [7, 8, 9] {7, 11} (9, 7) [9, 8, 7] {1, 2, 3, 4, 5, 6, 9} (7, 10) [7, 11, 10] {7, 8} (10, 7) [10, 11, 7] {1, 2, 3, 4, 5, 6, 10} (7, 11) [7, 11] {7, 8, 9} (11, 7) [11, 7] {1, 2, 3, 4, 5, 6, 10, 11} (8, 9) [8, 9] {7, 8, 11} (9, 8) [9, 8] {1, 2, 3, 4, 5, 6, 9, 10} (8, 10) [8, 9, 6, 10] {7, 8} (8, 10) [8, 7, 11, 10] {8, 9} (10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10} (8, 11) [8, 7, 11] {8, 9} (11, 8) [11, 7, 8] {10, 11} (9, 10) [9, 6, 10] {8, 9} (10, 9) [10, 6, 9] {10, 11} (11, 9) [11, 10, 6, 9] {7, 11} (9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9} (11, 9) [11, 7, 8, 9] {10, 11} (10, 11) [10, 11] {1, 2, 3, 4, 5, 6, 9, 10}

(11, 10) [11, 10] {7, 8, 11} o Σ(CFD): 237;

o Σ(CFD)2: 889;

o ΣA(CFD): 60.5;

o ΣA(CFD)2: 242;

o Matricea CFD:

CFD 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 2 2 2 2 3 3 3 3 3 3 26 2 8 0 2 2 8 4 4 4 4 4 4 44 3 8 8 0 8 8 5 5 5 5 5 5 62 4 8 2 2 0 8 4 4 4 4 4 4 44 5 2 2 2 2 0 3 3 3 3 3 3 26 6 6 6 6 6 6 0 7 7 8 8 7 67 7 3 3 3 3 3 2 0 3 2 2 3 27 8 4 4 4 4 4 2 8 0 3 2 2 37 9 5 5 5 5 5 3 7 8 0 2 7 52

10 5 5 5 5 5 3 7 7 2 0 8 52 11 4 4 4 4 4 2 8 2 2 3 0 37 Σ 53 41 35 41 53 31 56 46 36 36 46 474

o Σ(RCFD): 15.725;

o Σ(RCFD)2: 4.16(3);

o ΣA(RCFD): 3.308(3);

o ΣA(RCFD)2: 0.78(3);

o Matricea RCFD:

RCFD 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 0.500 0.500 0.500 0.500 0.333 0.333 0.333 0.333 0.333 0.333 4.0002 0.125 0.000 0.500 0.500 0.125 0.250 0.250 0.250 0.250 0.250 0.250 2.7503 0.125 0.125 0.000 0.125 0.125 0.200 0.200 0.200 0.200 0.200 0.200 1.7004 0.125 0.500 0.500 0.000 0.125 0.250 0.250 0.250 0.250 0.250 0.250 2.7505 0.500 0.500 0.500 0.500 0.000 0.333 0.333 0.333 0.333 0.333 0.333 4.0006 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.143 0.125 0.125 0.143 1.5127 0.333 0.333 0.333 0.333 0.333 0.500 0.000 0.333 0.500 0.500 0.333 3.8338 0.250 0.250 0.250 0.250 0.250 0.500 0.125 0.000 0.333 0.500 0.500 3.2089 0.200 0.200 0.200 0.200 0.200 0.333 0.143 0.125 0.000 0.500 0.143 2.244

10 0.200 0.200 0.200 0.200 0.200 0.333 0.143 0.143 0.500 0.000 0.125 2.24411 0.250 0.250 0.250 0.250 0.250 0.500 0.125 0.500 0.500 0.333 0.000 3.208Σ 2.275 3.025 3.400 3.025 2.275 3.533 2.045 2.611 3.325 3.325 2.611 31.450

÷ Matricea Cluj Fragmental pe Detururi, CFΔ:

o Definiţie: CFΔi,j = max|CFΔSi,j|; {k}∈CFΔSi,j ⇔ d(Gp)k,i<d(Gp)k,j | p∈Δ(G)i,j, Gp=G\p;

o Referinţe:

÷ Jäntschi L, Katona G, Diudea MV. 2000. Modeling Molecular Properties by Cluj

Indices. Commun Math Comput Chem 41:151-188.

÷ Jäntschi L. 2002. Graph Theory. 1. Fragmentation of Structural Graphs.

Leonardo El J Pract Technol 1(1):19-36.

o Enumerarea seturilor CFΔS:

(i,j) p∈Δ(G)i,j CFΔSi,j (1, 2) [1, 5, 4, 3, 2] {1} (2, 1) [2, 3, 4, 5, 1] {2} (1, 3) [1, 5, 4, 3] {1} (3, 1) [3, 4, 5, 1] {3, 6, 7, 8, 9, 10, 11} (1, 4) [1, 2, 3, 4] {1} (4, 1) [4, 3, 2, 1] {4} (1, 5) [1, 2, 3, 4, 5] {1} (5, 1) [5, 4, 3, 2, 1] {5} (1, 6) [1, 5, 4, 3, 6] {1, 2} (6, 1) [6, 3, 4, 5, 1] {6, 7, 8, 9, 10, 11} (1, 7) [1, 5, 4, 3, 6, 10, 11, 7] {1, 2} (7, 1) [7, 11, 10, 6, 3, 4, 5, 1] {7, 8, 9} (1, 7) [1, 5, 4, 3, 6, 9, 8, 7] {1, 2} (7, 1) [7, 8, 9, 6, 3, 4, 5, 1] {7, 10, 11} (1, 8) [1, 5, 4, 3, 6, 10, 11, 7, 8] {1, 2} (8, 1) [8, 7, 11, 10, 6, 3, 4, 5, 1] {8, 9} (1, 9) [1, 5, 4, 3, 6, 10, 11, 7, 8, 9] {1, 2} (9, 1) [9, 8, 7, 11, 10, 6, 3, 4, 5, 1] {9} (1, 10) [1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {1, 2} (10, 1) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1] {10} (1, 11) [1, 5, 4, 3, 6, 9, 8, 7, 11] {1, 2} (11, 1) [11, 7, 8, 9, 6, 3, 4, 5, 1] {10, 11} (2, 3) [2, 1, 5, 4, 3] {2} (3, 2) [3, 4, 5, 1, 2] {3, 6, 7, 8, 9, 10, 11} (2, 4) [2, 1, 5, 4] {2} (4, 2) [4, 5, 1, 2] {4} (2, 5) [2, 3, 4, 5] {2} (5, 2) [5, 4, 3, 2] {5} (2, 6) [2, 1, 5, 4, 3, 6] {2} (6, 2) [6, 3, 4, 5, 1, 2] {6, 7, 8, 9, 10, 11} (2, 7) [2, 1, 5, 4, 3, 6, 10, 11, 7] {2} (7, 2) [7, 11, 10, 6, 3, 4, 5, 1, 2] {7, 8, 9} (2, 7) [2, 1, 5, 4, 3, 6, 9, 8, 7] {2} (7, 2) [7, 8, 9, 6, 3, 4, 5, 1, 2] {7, 10, 11} (2, 8) [2, 1, 5, 4, 3, 6, 10, 11, 7, 8] {2} (8, 2) [8, 7, 11, 10, 6, 3, 4, 5, 1, 2] {8, 9} (2, 9) [2, 1, 5, 4, 3, 6, 10, 11, 7, 8, 9] {2} (9, 2) [9, 8, 7, 11, 10, 6, 3, 4, 5, 1, 2] {9} (2, 10) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {2} (10, 2) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10} (2, 11) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11] {2} (11, 2) [11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10, 11} (3, 4) [3, 2, 1, 5, 4] {3, 6, 7, 8, 9, 10, 11} (4, 3) [4, 5, 1, 2, 3] {4} (3, 5) [3, 2, 1, 5] {3, 6, 7, 8, 9, 10, 11}

(5, 3) [5, 1, 2, 3] {5} (3, 6) [3, 6] {1, 2, 3, 4, 5} (6, 3) [6, 3] {6, 7, 8, 9, 10, 11} (3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5} (7, 3) [7, 11, 10, 6, 3] {7, 8, 9} (3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5} (7, 3) [7, 8, 9, 6, 3] {7, 10, 11} (3, 8) [3, 6, 10, 11, 7, 8] {1, 2, 3, 4, 5} (8, 3) [8, 7, 11, 10, 6, 3] {8, 9} (3, 9) [3, 6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5} (9, 3) [9, 8, 7, 11, 10, 6, 3] {9} (3, 10) [3, 6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5} (10, 3) [10, 11, 7, 8, 9, 6, 3] {10} (3, 11) [3, 6, 9, 8, 7, 11] {1, 2, 3, 4, 5} (11, 3) [11, 7, 8, 9, 6, 3] {10, 11} (4, 5) [4, 3, 2, 1, 5] {4} (5, 4) [5, 1, 2, 3, 4] {5} (4, 6) [4, 5, 1, 2, 3, 6] {4} (6, 4) [6, 3, 2, 1, 5, 4] {6, 7, 8, 9, 10, 11} (4, 7) [4, 5, 1, 2, 3, 6, 10, 11, 7] {4} (7, 4) [7, 11, 10, 6, 3, 2, 1, 5, 4] {7, 8, 9} (4, 7) [4, 5, 1, 2, 3, 6, 9, 8, 7] {4} (7, 4) [7, 8, 9, 6, 3, 2, 1, 5, 4] {7, 10, 11} (4, 8) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8] {4} (8, 4) [8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {8, 9} (4, 9) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4} (9, 4) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {9} (4, 10) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4} (10, 4) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10} (4, 11) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11] {4} (11, 4) [11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10, 11} (5, 6) [5, 1, 2, 3, 6] {4, 5} (6, 5) [6, 3, 2, 1, 5] {6, 7, 8, 9, 10, 11} (5, 7) [5, 1, 2, 3, 6, 10, 11, 7] {4, 5} (7, 5) [7, 11, 10, 6, 3, 2, 1, 5] {7, 8, 9} (5, 7) [5, 1, 2, 3, 6, 9, 8, 7] {4, 5} (7, 5) [7, 8, 9, 6, 3, 2, 1, 5] {7, 10, 11} (5, 8) [5, 1, 2, 3, 6, 10, 11, 7, 8] {4, 5} (8, 5) [8, 7, 11, 10, 6, 3, 2, 1, 5] {8, 9} (5, 9) [5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4, 5} (9, 5) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5] {9} (5, 10) [5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4, 5} (10, 5) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5] {10} (5, 11) [5, 1, 2, 3, 6, 9, 8, 7, 11] {4, 5} (11, 5) [11, 7, 8, 9, 6, 3, 2, 1, 5] {10, 11} (6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9} (7, 6) [7, 11, 10, 6] {7, 8} (6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10} (7, 6) [7, 8, 9, 6] {7, 11} (6, 8) [6, 10, 11, 7, 8] {1, 2, 3, 4, 5, 6}

(8, 6) [8, 7, 11, 10, 6] {8} (6, 9) [6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5, 6} (9, 6) [9, 8, 7, 11, 10, 6] {9} (6, 10) [6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5, 6} (10, 6) [10, 11, 7, 8, 9, 6] {10} (6, 11) [6, 9, 8, 7, 11] {1, 2, 3, 4, 5, 6} (11, 6) [11, 7, 8, 9, 6] {11} (7, 8) [7, 11, 10, 6, 9, 8] {7} (8, 7) [8, 9, 6, 10, 11, 7] {8} (7, 9) [7, 11, 10, 6, 9] {7} (9, 7) [9, 6, 10, 11, 7] {9} (7, 10) [7, 8, 9, 6, 10] {7} (10, 7) [10, 6, 9, 8, 7] {10} (7, 11) [7, 8, 9, 6, 10, 11] {7} (11, 7) [11, 10, 6, 9, 8, 7] {11} (8, 9) [8, 7, 11, 10, 6, 9] {8} (9, 8) [9, 6, 10, 11, 7, 8] {9} (8, 10) [8, 9, 6, 10] {7, 8} (8, 10) [8, 7, 11, 10] {8, 9} (10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10} (8, 11) [8, 9, 6, 10, 11] {8} (11, 8) [11, 10, 6, 9, 8] {11} (9, 10) [9, 8, 7, 11, 10] {9} (10, 9) [10, 11, 7, 8, 9] {10} (11, 9) [11, 10, 6, 9] {7, 11} (9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9} (11, 9) [11, 7, 8, 9] {10, 11} (10, 11) [10, 6, 9, 8, 7, 11] {10} (11, 10) [11, 7, 8, 9, 6, 10] {11}

o Σ(CFΔ): 128;

o Σ(CFΔ)2: 273;

o ΣA(CFΔ): 27.5;

o ΣA(CFΔ)2: 63;

o Matricea CFΔ:

CFΔ 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 1 1 1 1 2 2 2 2 2 2 16 2 1 0 1 1 1 1 1 1 1 1 1 10 3 7 7 0 7 7 5 5 5 5 5 5 58 4 1 1 1 0 1 1 1 1 1 1 1 10 5 1 1 1 1 0 2 2 2 2 2 2 16 6 6 6 6 6 6 0 7 6 6 6 6 61 7 3 3 3 3 3 2 0 1 1 1 1 21 8 2 2 2 2 2 1 1 0 1 2 1 16 9 1 1 1 1 1 1 1 1 0 1 7 16

10 1 1 1 1 1 1 1 7 1 0 1 16 11 2 2 2 2 2 1 1 1 2 1 0 16 Σ 25 25 19 25 25 17 22 27 22 22 27 256

o Σ(RCFΔ): 37.9(3);

o Σ(RCFΔ)2: 26.6523809;

o ΣA(RCFΔ): 9.492857;

o ΣA(RCFΔ)2: 7.6523809;

o Matricea RCFΔ:

RCFΔ 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 1.000 1.000 1.000 1.000 0.500 0.500 0.500 0.500 0.500 0.500 7.0002 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.0003 0.143 0.143 0.000 0.143 0.143 0.200 0.200 0.200 0.200 0.200 0.200 1.7714 1.000 1.000 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.0005 1.000 1.000 1.000 1.000 0.000 0.500 0.500 0.500 0.500 0.500 0.500 7.0006 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.167 0.167 0.167 0.167 1.6437 0.333 0.333 0.333 0.333 0.333 0.500 0.000 1.000 1.000 1.000 1.000 6.1678 0.500 0.500 0.500 0.500 0.500 1.000 1.000 0.000 1.000 0.500 1.000 7.0009 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.000 1.000 0.143 9.143

10 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.143 1.000 0.000 1.000 9.14311 0.500 0.500 0.500 0.500 0.500 1.000 1.000 1.000 0.500 1.000 0.000 7.000Σ 6.643 6.643 7.500 6.643 6.643 7.700 7.343 6.510 6.867 6.867 6.510 75.867

÷ Matricea Szeged pe Distanţe (SzD) şi Detururi (SzΔ):

o Definiţie:

÷ SzDi,j = |SzDSi,j|; SzDSi,j={k | d(G)k,i<d(G)k,j}

÷ SzΔi,j = |SzΔSi,j|; SzΔSi,j={k | δ(G)k,i<δ(G)k,j}

o Referinţe:

÷ Gutman I. 1994. A Formula for the Wiener Number of Trees and Its Extension to

Graphs Containing Cycles. Graph Theory Notes NY 27:9-15.

÷ Jäntschi L. 2002. Graph Theory. 1. Fragmentation of Structural Graphs.

Leonardo El J Pract Technol 1(1):19-36.

o Enumerarea seturilor SzDS şi SzΔS:

(i,j) SzDSi,j SzDSj,i SzΔSi,j SzΔSj,i (1,2) {1,5} {2,3,6,7,8,9,10,11} {1,3,6,7,8,9,10,11} {2,5} (1,3) {1,5} {3,4,6,7,8,9,10,11} {1,4} {3,5,6,7,8,9,10,11}(2,3) {1,2} {3,4,6,7,8,9,10,11} {2,4} {1,3,6,7,8,9,10,11}(1,4) {1,2} {3,4,6,7,8,9,10,11} {1,3,6,7,8,9,10,11} {2,4} (2,4) {1,2} {4,5} {2,5} {1,4} (3,4) {2,3,6,7,8,9,10,11} {4,5} {3,5,6,7,8,9,10,11} {2,4} (1,5) {1,2} {4,5} {1,4} {2,5} (2,5) {2,3,6,7,8,9,10,11} {4,5} {2,4} {3,5,6,7,8,9,10,11}(3,5) {2,3,6,7,8,9,10,11} {1,5} {1,3,6,7,8,9,10,11} {2,5} (4,5) {3,4,6,7,8,9,10,11} {1,5} {1,4} {3,5,6,7,8,9,10,11}(1,6) {1,2,5} {3,6,7,8,9,10,11} {1,2,4} {3,6,7,8,9,10,11} (2,6) {1,2,5} {6,7,8,9,10,11} {2,4,5} {3,6,7,8,9,10,11} (3,6) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {6,7,8,9,10,11} (4,6) {1,4,5} {6,7,8,9,10,11} {1,2,4} {3,6,7,8,9,10,11} (5,6) {1,4,5} {3,6,7,8,9,10,11} {2,4,5} {3,6,7,8,9,10,11} (1,7) {1,2,3,4,5} {7,8,9,10,11} {1,2,3,4,5} {6,7,8,9,10,11}

(2,7) {1,2,3,4,5,6} {7,8,9,10,11} {1,2,4,5} {6,7,8,9,10,11} (3,7) {1,2,3,4,5,6} {7,8,11} {1,2,3,4,5,6} {7,9,10} (4,7) {1,2,3,4,5,6} {7,8,9,10,11} {1,2,4,5} {6,7,8,9,10,11} (5,7) {1,2,3,4,5} {7,8,9,10,11} {1,2,3,4,5} {6,7,8,9,10,11} (6,7) {1,2,3,4,5,6,9,10} {7,8,11} {1,2,3,4,5,6,8,11} {7,9,10} (1,8) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (2,8) {1,2,3,4,5} {7,8,9,11} {1,2,3,4,5} {6,7,8,9,10,11} (3,8) {1,2,3,4,5,6,10} {7,8,9,11} {1,2,3,4,5,6,7} {8,9,10,11} (4,8) {1,2,3,4,5} {7,8,9,11} {1,2,3,4,5} {6,7,8,9,10,11} (5,8) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (6,8) {1,2,3,4,5,6,10} {7,8} {1,2,3,4,5,6,7} {8,10} (7,8) {7,10,11} {1,2,3,4,5,6,8,9} {1,2,3,4,5,6,7,9} {8,10,11} (1,9) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11} (2,9) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (3,9) {1,2,3,4,5} {7,8,9} {1,2,3,4,5,6} {9,10,11} (4,9) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (5,9) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11} (6,9) {1,2,3,4,5,6,10,11} {7,8,9} {1,2,3,4,5,6,7,8} {9,10,11} (7,9) {7,11} {1,2,3,4,5,6,9} {1,2,3,4,5,6,7} {9,11} (8,9) {7,8,11} {1,2,3,4,5,6,9,10} {1,2,3,4,5,6,8,10} {7,9,11} (1,10) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11} (2,10) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (3,10) {1,2,3,4,5} {7,10,11} {1,2,3,4,5,6} {8,9,10} (4,10) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (5,10) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11} (6,10) {1,2,3,4,5,6,8,9} {7,10,11} {1,2,3,4,5,6,7,11} {8,9,10} (7,10) {7,8} {1,2,3,4,5,6,10} {1,2,3,4,5,6,7} {8,10} (8,10) {7,8,9} {1,2,3,4,5,6,10,11} {1,2,3,4,5,6,8,11} {7,9,10} (9,10) {8,9} {10,11} {9,11} {8,10} (1,11) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (2,11) {1,2,3,4,5} {7,8,10,11} {1,2,3,4,5} {6,7,8,9,10,11} (3,11) {1,2,3,4,5,6,9} {7,8,10,11} {1,2,3,4,5,6,7} {8,9,10,11} (4,11) {1,2,3,4,5} {7,8,10,11} {1,2,3,4,5} {6,7,8,9,10,11} (5,11) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (6,11) {1,2,3,4,5,6,9} {7,11} {1,2,3,4,5,6,7} {9,11} (7,11) {7,8,9} {1,2,3,4,5,6,10,11} {1,2,3,4,5,6,7,10} {8,9,11} (8,11) {8,9} {10,11} {8,10} {9,11} (9,11) {1,2,3,4,5,6,8,9} {7,10,11} {7,9,10} {1,2,3,4,5,6,8,11} (10,11) {1,2,3,4,5,6,9,10} {7,8,11} {7,8,10} {1,2,3,4,5,6,9,11} o Σ(SzD): 266.5;

o Σ(SzD)2: 1154;

o ΣA(SzD): 60.5;

o ΣA(SzD)2: 242;

o Matricea SzD:

SzD 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 2 2 2 2 3 5 5 4 4 5 34 2 8 0 2 2 8 3 6 5 5 5 5 49 3 8 8 0 8 8 5 6 7 5 5 7 67

4 8 2 2 0 8 3 6 5 5 5 5 49 5 2 2 2 2 0 3 5 5 4 4 5 34 6 7 6 6 6 7 0 8 7 8 8 7 70 7 5 5 3 5 5 3 0 3 2 2 3 36 8 6 4 4 4 6 2 8 0 3 3 2 42 9 6 6 3 6 6 3 7 8 0 2 8 55

10 6 6 3 6 6 3 7 8 2 0 8 55 11 6 4 4 4 6 2 8 2 3 3 0 42 Σ 62 45 31 45 62 30 66 55 41 41 55 533

o Σ(RSzD): 14.15059;

o Σ(RSzD)2: 3.440714;

o ΣA(RSzD): 3.308(3);

o ΣA(RSzD)2: 0.78(3);

o Matricea RSzD:

RSzD 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 0.500 0.500 0.500 0.500 0.333 0.200 0.200 0.250 0.250 0.200 3.4332 0.125 0.000 0.500 0.500 0.125 0.333 0.167 0.200 0.200 0.200 0.200 2.5503 0.125 0.125 0.000 0.125 0.125 0.200 0.167 0.143 0.200 0.200 0.143 1.5524 0.125 0.500 0.500 0.000 0.125 0.333 0.167 0.200 0.200 0.200 0.200 2.5505 0.500 0.500 0.500 0.500 0.000 0.333 0.200 0.200 0.250 0.250 0.200 3.4336 0.143 0.167 0.167 0.167 0.143 0.000 0.125 0.143 0.125 0.125 0.143 1.4467 0.200 0.200 0.333 0.200 0.200 0.333 0.000 0.333 0.500 0.500 0.333 3.1338 0.167 0.250 0.250 0.250 0.167 0.500 0.125 0.000 0.333 0.333 0.500 2.8759 0.167 0.167 0.333 0.167 0.167 0.333 0.143 0.125 0.000 0.500 0.125 2.226

10 0.167 0.167 0.333 0.167 0.167 0.333 0.143 0.125 0.500 0.000 0.125 2.22611 0.167 0.250 0.250 0.250 0.167 0.500 0.125 0.500 0.333 0.333 0.000 2.875Σ 1.885 2.825 3.667 2.825 1.885 3.533 1.561 2.169 2.892 2.892 2.169 28.301

o Σ(SzΔ): 270.5;

o Σ(SzΔ)2: 1188;

o ΣA(SzΔ): 60.5;

o ΣA(SzΔ)2: 242;

o Matricea SzΔ:

SzΔ 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 8 2 8 2 3 5 5 6 6 5 50 2 2 0 2 2 2 3 4 5 5 5 5 35 3 8 8 0 8 8 5 6 7 6 6 7 69 4 2 2 2 0 2 3 4 5 5 5 5 35 5 2 8 2 8 0 3 5 5 6 6 5 50 6 7 7 6 7 7 0 8 7 8 8 7 72 7 6 6 3 6 6 3 0 8 7 7 8 60 8 5 6 4 6 5 2 3 0 8 8 2 49 9 5 5 3 5 5 3 2 3 0 2 3 36

10 5 5 3 5 5 3 2 3 2 0 3 36 11 5 6 4 6 5 2 3 2 8 8 0 49 Σ 47 61 31 61 47 30 42 50 61 61 50 541

o Σ(RSzΔ): 13.9767857;

o Σ(RSzΔ)2: 3.3592857;

o ΣA(RSzΔ): 3.308(3);

o ΣA(RSzΔ)2: 0.78(3);

o Matricea RSzΔ:

RSzΔ 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 0.125 0.500 0.125 0.500 0.333 0.200 0.200 0.167 0.167 0.200 2.5172 0.500 0.000 0.500 0.500 0.500 0.333 0.250 0.200 0.200 0.200 0.200 3.3833 0.125 0.125 0.000 0.125 0.125 0.200 0.167 0.143 0.167 0.167 0.143 1.4864 0.500 0.500 0.500 0.000 0.500 0.333 0.250 0.200 0.200 0.200 0.200 3.3835 0.500 0.125 0.500 0.125 0.000 0.333 0.200 0.200 0.167 0.167 0.200 2.5176 0.143 0.143 0.167 0.143 0.143 0.000 0.125 0.143 0.125 0.125 0.143 1.3997 0.167 0.167 0.333 0.167 0.167 0.333 0.000 0.125 0.143 0.143 0.125 1.8698 0.200 0.167 0.250 0.167 0.200 0.500 0.333 0.000 0.125 0.125 0.500 2.5679 0.200 0.200 0.333 0.200 0.200 0.333 0.500 0.333 0.000 0.500 0.333 3.133

10 0.200 0.200 0.333 0.200 0.200 0.333 0.500 0.333 0.500 0.000 0.333 3.13311 0.200 0.167 0.250 0.167 0.200 0.500 0.333 0.500 0.125 0.125 0.000 2.567Σ 2.735 1.918 3.667 1.918 2.735 3.533 2.858 2.377 1.918 1.918 2.377 27.954

÷ Produsul Hadamard a două matrici H(·,·):

o Definiţie: H(A,B)i,j=Ai,j·Bi,j;

o Aplicaţii:

Hadamard CJD CJΔ CFD CFΔ SzD SzΔ D H(D,CJD) H(D,CJΔ) H(D,CFD) H(D,CFΔ) H(D,SzD) H(D,SzΔ) Δ H(Δ,CJD) H(Δ,CJΔ) H(Δ,CFD) H(Δ,CFΔ) H(Δ,SzD) H(Δ,SzΔ)

o Indici pe matricile Hadamard:

H(·,·) Σ(·) Σ(·)2 ΣA(·) ΣA(·)2 Σ(1/(·)) Σ(1/(·))2 ΣA(1/(·))2 ΣA(1/(·))2 H(D,CJD) 600 6954 60.5 242 7.971 1.315 3.308 0.783 H(D,CJΔ) 347 2491 27.5 63 19.834 10.582 9.493 7.652 H(D,CFD) 622 7616 60.5 242 7.717 1.278 3.308 0.783 H(D,CFΔ) 349 2571 27.5 63 19.813 10.580 9.493 7.652 H(D,SzD) 756 13048 60.5 242 7.389 1.250 3.308 0.783 H(D,SzΔ) 769 13500 60.5 242 7.333 1.238 3.308 0.783 H(Δ,CJD) 1292 32244 258.5 4718 3.574 0.255 0.896 0.075 H(Δ,CJΔ) 653 6885 104.5 702 7.676 1.243 2.252 0.412 H(Δ,CFD) 1338 35082 258.5 4718 3.437 0.244 0.896 0.075 H(Δ,CFΔ) 655 6965 104.5 702 7.655 1.241 2.252 0.412 H(Δ,SzD) 1564 51568 258.5 4718 3.189 0.224 0.896 0.075 H(Δ,SzΔ) 1592 53560 258.5 4718 3.166 0.222 0.896 0.075

÷ Produsul Schultz a două matrici S(·,A,·):

o Definiţie: S(X,A,Y)i,j=X(A+Y);

o Aplicaţii:

Schultz CJD CJΔ CFD CFΔ SzD SzΔ A S(A,A,CJD) S(A,A,CJΔ) S(A,A,CFD) S(A,A,CFΔ) S(A,A,SzD) S(A,A,SzΔ)D S(D,A,CJD) S(D,A,CJΔ) S(D,A,CFD) S(D,A,CFΔ) S(D,A,SzD) S(D,A,SzΔ)Δ S(Δ,A,CJD) S(Δ,A,CJΔ) S(Δ,A,CFD) S(Δ,A,CFΔ) S(Δ,A,SzD) S(Δ,A,SzΔ)o Indici pe matricile Schultz:

S(·,A,·) Σ(·) Σ(·)2 ΣA(·) ΣA(·)2 Σ(1/(·)) Σ(1/(·))2 ΣA(1/(·))2 ΣA(1/(·))2

S(A,A,CJD) 550.5 4833.5 61 248 8.76175 1.31487 3.47024 0.72197S(A,A,CJΔ) 341.5 1987.5 35 59 16.89960 6.16609 8.11905 4.48810S(A,A,CFD) 565.5 5205.5 64 292 8.46774 1.26196 3.41607 0.70670S(A,A,CFΔ) 342.5 2003.5 35 59 16.81627 6.14526 8.11905 4.48810S(A,A,SzD) 628.5 6339.5 61 248 7.90838 1.13978 3.47024 0.72197S(A,A,SzΔ) 638.5 7171.5 63 342 7.49169 1.45677 3.43849 1.08596S(D,A,CJD) 6358.5 728779 1215 137976 0.57811 0.00663 0.13649 0.00177S(D,A,CJΔ) 3573.5 217760 712 45023 1.01352 0.01929 0.22652 0.00467S(D,A,CFD) 6576 764461 1278.5 147548 0.55208 0.00590 0.12597 0.00145S(D,A,CFΔ) 3591 219152 718.5 45529 1.00766 0.01898 0.22338 0.00450S(D,A,SzD) 7440 1002756 1515.5 219149 0.49894 0.00496 0.11222 0.00123S(D,A,SzΔ) 7786 1016184 1548.5 208403 0.47479 0.00423 0.10478 0.00102S(Δ,A,CJD) 13560.5 3120452 2446 527736 0.27149 0.00139 0.06576 0.00039S(Δ,A,CJΔ) 7227.5 887001 1330 150684 0.50828 0.00483 0.12147 0.00126S(Δ,A,CFD) 14022 3290896 2598.5 573094 0.25910 0.00124 0.06093 0.00032S(Δ,A,CFΔ) 7255 890817 1339.5 151878 0.50613 0.00476 0.12055 0.00123S(Δ,A,SzD) 15724 4220049 2992.5 802176 0.23648 0.00106 0.05506 0.00028S(Δ,A,SzΔ) 15684 4367127 2991.5 792573 0.23389 0.00108 0.05216 0.00025

Polinoame

Polinoamele au aplicaţii importante în topologia moleculară. Următoarele polinoame sunt

definite:

÷ Polinomul caracteristic (ChP) asociat unui graf G [Bolboacă SD, Jäntschi L. 2007. How Good

the Characteristic Polynomial Can Be for Correlations? Int J Mol Sci 8(4):335-345] se obţine pe

baza matricii de adiacenţă A=A(G) astfel: ChP(G,X)=det[XI-A(G)]

÷ Polinoamele de numărare (CDi, CMx, CcM, CSz, CCf) se definesc astfel [Jäntschi L. 2007.

Characteristic and Counting Polynomials of Nonane Isomers. Cluj: AcademicDirect, p. 101]:

C(G,M,X) = Σk≥0|{Mi,j , |Mi,j| = k}|Xk, unde M=D, Mx, cM, Sz, Cf.

În tabelul 10 este redată matricea caracteristică, iar în Tabelele 11-15 sunt redate matricile

de numărare CDi, CMx, CcM, CSz, CCf asociate grafului molecular din Tabelul 9.

Tabelul 10. Matricea caracteristică a grafului molecular din Tabelul 9 [Ch] 1 2 3 4 5 6 7 8 9 10 11 1 X -1 0 0 -1 0 0 0 0 0 0 2 -1 X -1 0 0 0 0 0 0 0 0 3 0 -1 X -1 0 -1 0 0 0 0 0 4 0 0 -1 X -1 0 0 0 0 0 0 5 -1 0 0 -1 X 0 0 0 0 0 0 6 0 0 -1 0 0 X 0 0 -1 -1 0 7 0 0 0 0 0 0 X -1 0 0 -1 8 0 0 0 0 0 0 -1 X -1 0 0 9 0 0 0 0 0 -1 0 -1 X 0 0 10 0 0 0 0 0 -1 0 0 0 X -1 11 0 0 0 0 0 0 -1 0 0 -1 X ChP X11 - 12X9 + 51X7 - 2X6 - 95X5 + 12X4 + 78X3 - 18X2 - 23X1 + 8

Tabelul 11. Matricea de numărare pe distanţe a grafului molecular din Tabelul 9 [Di] 1 2 3 4 5 6 7 8 9 10 11 1 0 1 2 2 1 3 6 5 4 4 5 2 1 0 1 2 2 2 5 4 3 3 4 3 2 1 0 1 2 1 4 3 2 2 3 4 2 2 1 0 1 2 5 4 3 3 4 5 1 2 2 1 0 3 6 5 4 4 5 6 3 2 1 2 3 0 3 2 1 1 2 7 6 5 4 5 6 3 0 1 2 2 1 8 5 4 3 4 5 2 1 0 1 3 2 9 4 3 2 3 4 1 2 1 0 2 3 10 4 3 2 3 4 1 2 3 2 0 1 11 5 4 3 4 5 2 1 2 3 1 0 CDi 4X6 + 12X5 + 18X4 + 22X3 + 30X2 + 24X1 + 11

Tabelul 12. Matricea fragmentelor maximale pentru graful molecular din Tabelul 9

[Mx] 1 2 3 4 5 6 7 8 9 10 11 1 1 3 4 5

6 7 8 9 10 11

1 2 4 5

1 2 3 5 6 7 8 9 10 11

1 2 3 4 6 7 8 9 10 11

1 2 3 4 5

1 2 3 4 5 6 8 9 10 11

1 2 3 4 5 6 7 9 10 11

1 2 3 4 5 6 7 8 10 11

1 2 3 4 5 6 7 8 9 11

1 2 3 4 5 6 7 8 9 10

2 2 3 4 5 6 7 8 9 10 11

1 2 4 5

1 2 3 5 6 7 8 9 10 11

1 2 3 4 6 7 8 9 10 11

1 2 3 4 5

1 2 3 4 5 6 8 9 10 11

1 2 3 4 5 6 7 9 10 11

1 2 3 4 5 6 7 8 10 11

1 2 3 4 5 6 7 8 9 11

1 2 3 4 5 6 7 8 9 10

3 2 3 4 5 6 7 8 9 10 11

1 3 4 5 6 7 8 9 10 11

1 2 3 5 6 7 8 9 10 11

1 2 3 4 6 7 8 9 10 11

1 2 3 4 5

1 2 3 4 5 6 8 9 10 11

1 2 3 4 5 6 7 9 10 11

1 2 3 4 5 6 7 8 10 11

1 2 3 4 5 6 7 8 9 11

1 2 3 4 5 6 7 8 9 10

4 2 3 4 5 6 7 8 9 10 11

1 3 4 5 6 7 8 9 10 11

1 2 4 5

1 2 3 4 6 7 8 9 10 11

1 2 3 4 5

1 2 3 4 5 6 8 9 10 11

1 2 3 4 5 6 7 9 10 11

1 2 3 4 5 6 7 8 10 11

1 2 3 4 5 6 7 8 9 11

1 2 3 4 5 6 7 8 9 10

5 2 3 4 5 6 7 8 9 10 11

1 3 4 5 6 7 8 9 10 11

1 2 4 5

1 2 3 5 6 7 8 9 10 11

1 2 3 4 5

1 2 3 4 5 6 8 9 10 11

1 2 3 4 5 6 7 9 10 11

1 2 3 4 5 6 7 8 10 11

1 2 3 4 5 6 7 8 9 11

1 2 3 4 5 6 7 8 9 10

6 2 3 4 5 6 7 8 9 10 11

1 3 4 5 6 7 8 9 10 11

6 7 8 9 10 11

1 2 3 5 6 7 8 9 10 11

1 2 3 4 6 7 8 9 10 11

1 2 3 4 5 6 8 9 10 11

1 2 3 4 5 6 7 9 10 11

1 2 3 4 5 6 7 8 10 11

1 2 3 4 5 6 7 8 9 11

1 2 3 4 5 6 7 8 9 10

7 2 3 4 5 6 7 8 9 10 11

1 3 4 5 6 7 8 9 10 11

6 7 8 9 10 11

1 2 3 5 6 7 8 9 10 11

1 2 3 4 6 7 8 9 10 11

7 8 9 10 11

1 2 3 4 5 6 7 9 10 11

1 2 3 4 5 6 7 8 10 11

1 2 3 4 5 6 7 8 9 11

1 2 3 4 5 6 7 8 9 10

8 2 3 4 5 6 7 8 9 10 11

1 3 4 5 6 7 8 9 10 11

6 7 8 9 10 11

1 2 3 5 6 7 8 9 10 11

1 2 3 4 6 7 8 9 10 11

7 8 9 10 11

1 2 3 4 5 6 8 9 10 11

1 2 3 4 5 6 7 8 10 11

1 2 3 4 5 6 7 8 9 11

1 2 3 4 5 6 7 8 9 10

9 2 3 4 5 6 7 8 9 10 11

1 3 4 5 6 7 8 9 10 11

6 7 8 9 10 11

1 2 3 5 6 7 8 9 10 11

1 2 3 4 6 7 8 9 10 11

7 8 9 10 11

1 2 3 4 5 6 8 9 10 11

1 2 3 4 5 6 7 9 10 11

1 2 3 4 5 6 7 8 9 11

1 2 3 4 5 6 7 8 9 10

10 2 3 4 5 6 7 8 9 10 11

1 3 4 5 6 7 8 9 10 11

6 7 8 9 10 11

1 2 3 5 6 7 8 9 10 11

1 2 3 4 6 7 8 9 10 11

7 8 9 10 11

1 2 3 4 5 6 8 9 10 11

1 2 3 4 5 6 7 9 10 11

1 2 3 4 5 6 7 8 10 11

1 2 3 4 5 6 7 8 9 10

11 2 3 4 5 6 7 8 9 10 11

1 3 4 5 6 7 8 9 10 11

6 7 8 9 10 11

1 2 3 5 6 7 8 9 10 11

1 2 3 4 6 7 8 9 10 11

7 8 9 10 11

1 2 3 4 5 6 8 9 10 11

1 2 3 4 5 6 7 9 10 11

1 2 3 4 5 6 7 8 10 11

1 2 3 4 5 6 7 8 9 11

CMx 90X10 + 6X6 + 10X5 + 4X4 +11

Tabelul 13. Matricea fragmentelor complement-maximale pentru graful molecular din Tabelul 9 [cM] 1 2 3 4 5 6 7 8 9 10 11 1 2 3 6 7 8 9 10 11 4 5 6 7 8 9 10 11 7 8 9 10 11 2 1 3 6 7 8 9 10 11 4 5 6 7 8 9 10 11 7 8 9 10 11 3 1 2 4 5 6 7 8 9 10 11 7 8 9 10 11 4 1 2 3 6 7 8 9 10 11 5 6 7 8 9 10 11 7 8 9 10 11 5 1 2 3 6 7 8 9 10 11 4 6 7 8 9 10 11 7 8 9 10 11 6 1 2 1 2 3 4 5 4 5 7 8 9 10 11 7 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 8 9 10 11 8 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 9 10 11 9 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 8 10 11 10 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 8 9 11 11 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 8 9 10 CcM 4X7 + 10X6 + 6X5 + 90X1 + 11

Tabelul 14. Matricea fragmentelor Szged pentru graful molecular din Tabelul 9

[Sz] 1 2 3 4 5 6 7 8 9 10 11 1 1 5 1 5 1 2 1 2 1 2

5 1 2 3 4 5

1 2 3 4 5

1 2 4 5 1 2 4 5 1 2 3 4 5

2 2 3 6 7 8 9 10 11

1 2 1 2 2 3 6 7 8 9 10 11

1 2 5

1 2 3 4 5 6

1 2 3 4 5

1 2 3 4 5

1 2 3 4 5

1 2 3 4 5

3 3 4 6 7 8 9 10 11

3 4 6 7 8 9 10 11

2 3 6 7 8 9 10 11

2 3 6 7 8 9 10 11

1 2 3 4 5

1 2 3 4 5 6

1 2 3 4 5 6 10

1 2 3 4 5

1 2 3 4 5

1 2 3 4 5 6 9

4 3 4 6 7 8 9 10 11

4 5 4 5 3 4 6 7 8 9 10 11

1 4 5

1 2 3 4 5 6

1 2 3 4 5

1 2 3 4 5

1 2 3 4 5

1 2 3 4 5

5 4 5 4 5 1 5 1 5 1 4 5

1 2 3 4 5

1 2 3 4 5

1 2 4 5 1 2 4 5 1 2 3 4 5

6 3 6 7 8 9 10 11

6 7 8 9 10 11

6 7 8 9 10 11

6 7 8 9 10 11

3 6 7 8 9 10 11

1 2 3 4 5 6 9 10

1 2 3 4 5 6 10

1 2 3 4 5 6 10 11

1 2 3 4 5 6 8 9

1 2 3 4 5 6 9

7 7 8 9 10 11

7 8 9 10 11

7 8 11 7 8 9 10 11

7 8 9 10 11

7 8 11

7 10 11 7 11 7 8 7 8 9

8 6 7 8 9 10 11

7 8 9 11

7 8 9 11

7 8 9 11

6 7 8 9 10 11

7 8 1 2 3 4 5 6 8 9

7 8 11 7 8 9 8 9

9 6 7 8 9 10 11

6 7 8 9 10 11

7 8 9 6 7 8 9 10 11

6 7 8 9 10 11

7 8 9

1 2 3 4 5 6 9

1 2 3 4 5 6 9 10

8 9 1 2 3 4 5 6 8 9

10 6 7 8 9 10 11

6 7 8 9 10 11

7 10 11

6 7 8 9 10 11

6 7 8 9 10 11

7 10 11

1 2 3 4 5 6 10

1 2 3 4 5 6 10 11

10 11 1 2 3 4 5 6 9 10

11 6 7 8 9 10 11

7 8 10 11

7 8 10 11

7 8 10 11

6 7 8 9 10 11

7 11 1 2 3 4 5 6 10 11

10 11 7 10 11 7 8 11

CSz 17X8 + 8X7 + 18X6 + 21X5 + 10X4 + 16X3 + 20X2 + 11

Tabelul 15. Matricea fragmentelor Cluj pentru graful molecular din Tabelul 9 [Cf] 1 2 3 4 5 6 7 8 9 10 11 1 1 5 1 5 1 2 1 2 1 4

5 1 4 5 1 4 5 1 4 5 1 4 5 1 4 5

2 2 3 6 7 8 9 10 11

1 2 1 2 2 3 6 7 8 9 10 11

1 2 4 5

1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5

3 3 4 6 7 8 9 10 11

3 4 6 7 8 9 10 11

2 3 6 7 8 9 10 11

2 3 6 7 8 9 10 11

1 2 3 4 5

1 2 3 4 5

1 2 3 4 5

1 2 3 4 5

1 2 3 4 5

1 2 3 4 5

4 3 4 6 7 8 9 10 11

4 5 4 5 3 4 6 7 8 9 10 11

1 2 4 5

1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5

5 4 5 4 5 1 5 1 5 1 2 5

1 2 5 1 2 5 1 2 5 1 2 5 1 2 5

6 6 7 8 9 10 11

6 7 8 9 10 11

6 7 8 9 10 11

6 7 8 9 10 11

6 7 8 9 10 11

1 2 3 4 5 6 10

1 2 3 4 5 6 10

1 2 3 4 5 6 10 11

1 2 3 4 5 6 8 9

1 2 3 4 5 6 9

7 7 10 11 7 10 11 7 10 11

7 10 11 7 10 11 7 11 7 10 11 7 11 7 8 7 8 9

8 7 8 10 11

7 8 10 11

7 8 10 11

7 8 10 11

7 8 10 11

7 8 1 2 3 4 5 6 8 9

7 8 11 8 9 8 9

9 7 8 9 10 11

7 8 9 10 11

7 8 9 10 11

7 8 9 10 11

7 8 9 10 11

7 8 9

1 2 3 4 5 6 9

1 2 3 4 5 6 9 10

8 9 1 2 3 4 5 6 9

10 7 8 9 10 11

7 8 9 10 11

7 8 9 10 11

7 8 9 10 11

7 8 9 10 11

7 10 11

1 2 3 4 5 6 10

1 2 3 4 5 6 10

10 11 1 2 3 4 5 6 9 10

11 7 8 9 11 7 8 9 11 7 8 9 11

7 8 9 11 7 8 9 11 7 11 1 2 3 4 5 6 10 11

10 11 10 11 7 8 11

CCf 14X8 + 7X7 + 5X6 + 16X5 + 22X4 + 23X3 + 23X2 +11

Chimie Cuantică

Se bazează pe modelul ondulatoriu al mecanicii atomilor şi moleculelor propus de

Schrödinger în 1926 [An Undulatory Theory of the Mechanics of Atoms and Molecules, Phys Rev, 28(6),

1049-1070]. Două forme ale ecuaţiei lui Schrödinger sunt folosite (una dependentă de timp şi

cealaltă independentă de timp), dintre care ecuaţia independentă de timp (EΨ = ĤΨ) răspunde

problematicii structurii chimice la echilibru, şi anume:

÷ Unde sunt electronii şi nucleele unei molecule localizaţi în spaţiu? - şi din răspunsul la această

întrebare derivă o serie de consecinţe cum sunt: configuraţia, conformaţia, mărimea, forma, etc.

÷ Sub un set dat de condiţii (de mediu) care sunt energiile (atomilor şi moleculelor)? - şi din

răspunsul la această întrebare rezultă o serie de proprietăţi moleculare: căldura de formare,

stabilitatea conformaţională, reactivitatea chimică, proprietăţile spectrale, etc.

Termodinamica stabileşte relaţii cantitative între variabile macroscopice (volum, presiune,

temperatură, concentraţie) ce definesc un sistem fizico-chimic de proporţii mari, comparativ cu

dimensiunile corpusculilor constituenţi (atomi, molecule, etc.). Tipul de sistem este determinat de

caracteristicile suprafeţei de separare:

÷ sistem deschis / închis - materia poate fi / nu poate fi transferată prin suprafaţa de separare;

o sistemele închise şi deschise pot schimba energie cu mediul înconjurător;

÷ sistem izolat - sistem închis care nu este în contact mecanic şi termic cu mediul înconjurător;

÷ proces - transformare de stare (dilatare, răcire) sau transformare în starea fizică (topire,

solidificare) sau transformare chimică complexă (se formează noi substanţe).

÷ lucru este efectuat de sistem dacă în urma unui proces rezultă o energie cu care poate fi ridicată

o greutate în mediu.

Energia unui sistem poate varia şi ca urmare a unui transfer de căldură:

÷ proces exoterm - proces în care se degajă energie sub formă de căldură;

÷ proces endoterm - proces care absoarbe energie sub formă de căldură;

÷ proces adiabatic - proces care se desfăşoară într-un sistem izolat adiabatic;

o suprafeţele de separare adiabatice - nu permit transferul de căldură;

Mişcarea haotică a moleculelor se numeşte mişcare termică. Din punct de vedere molecular,

lucrul este transferul de energie datorită mişcării ordonate. Distincţia între căldură şi lucru se

realizează în mediu. Din punct de vedere molecular, cele două noţiuni pot fi definite astfel:

÷ Lucrul este transferul de energie ce foloseşte mişcarea ordonată a atomilor din mediu;

÷ Căldura este transferul de energie ce foloseşte mişcarea termică a atomilor din mediu.

Principiul I al termodinamicii introduce noţiunea de energie internă:

÷ Energia internă U este energia totală a unui sistem. Ea este o funcţie de stare: ΔU = Uf - Ui

÷ U este o funcţie de proprietăţile care determină starea sistemului la un moment dat şi

independentă de calea prin care s-a ajuns la starea respectivă: U = U(n,p,...)

÷ Căldura şi lucrul sunt căi echivalente pentru variaţia energiei interne a unui sistem. Dacă un

sistem este izolat de mediul înconjurător atunci nu are loc nici o variaţie de energie internă, sau,

nu există nici o maşină care efectuează lucru mecanic fără consum energetic (perpetuum mobile

de speţa I): energia internă a unui sistem izolat este constantă (Principiul I);

Formularea principiului I nu menţionează căldura, însă o implică şi permite o definire a

căldurii pe baza lucrului.

Fie două stări ale unui sistem, U1 şi U2 şi fie două transformări, una adiabatică şi una oarecare.

Pentru transformarea adiabatică avem (conservarea energiei pentru sistem): ΔU = U2 - U1 = wad iar

pentru transformarea oarecare avem (conservarea energiei pentru sistem): ΔU = U2 - U1 = w + q,

unde q este cantitatea de energie neexplicată prin lucru sau energie internă. Diferenţa wad-w este

pusă pe seama căldurii absorbite de sistem (conservarea energiei pentru mediu): q = wad - w, de

unde: q = ΔU - w. Concluzionând, variaţia de energie internă ΔU depinde de energia transferată

unui sistem sub formă de căldură q şi lucrul efectuat asupra unui sistem w prin: ΔU = q + w. Dacă

se consideră variaţii infinitezimale, avem: dU = dq + dw. Transformarea pe care o suferă sistemul

este cvasistatică dacă mişcarea sa este atât de lentă comparativ cu procesele care disipează energie

şi materie în mediu încât peste tot în sistem presiunea şi temperatura sunt independente de spaţiu

(pot fi însă dependente de timp).

Dacă descompunem dw în dw = dwe + dwexp unde dwexp lucrul mecanic de expansiune şi

dwe un lucru mecanic suplimentar necauzat de expansiune, atunci: dU = dq + dwe + dwexp. Astfel,

pentru sistemele ce evoluează la volum constant dwexp = 0; pentru sistemele care nu efectuează nici

un fel de lucru (electric, optic, etc) şi dwe = 0; în aceste condiţii: dU = dq (la volum constant, fără

lucru suplimentar). Pentru o transformare finită: ΔU = q, deci prin măsurarea energiei primite de la

un sistem la volum constant sub formă de căldură (q>0) sau obţinută de el sub formă de căldură

(q<0) în timpul unei transformări de stare, se măsoară de fapt variaţia energiei sale interne ΔU.

De obicei perechea de variabile de stare independente: temperatura şi presiunea reprezintă

condiţiile fireşti de desfăşurare ale reacţiilor chimice şi proceselor fizico-chimice. Multe procese au

loc în condiţii de presiune atmosferică şi temperatură ambiantă.

Astfel, adaptând principiul I al termodinamicii la condiţiile menţionate mai sus, a luat

naştere o nouă funcţie de stare numită entalpie, care se notează cu H şi care însumează energia

internă cu lucrul mecanic necesar pentru ocuparea de către sistem a volumului său propriu V la

presiunea de lucru p: H = U + pV. O variaţie de entalpie este egală cu căldura absorbită la

temperatură constantă de către sistem atâta timp cât sistemul nu efectuează şi lucru suplimentar: dH

= dq = dU (la presiune constantă, fără lucru suplimentar). Pentru o transformare finită: ΔH = qv,p.

Proprietăţile unei probe independente de modul în care se obţine proba se numesc funcţii de

stare. Ele pot fi privite ca fiind funcţie de alţi parametri fundamentali, ca presiunea, temperatura şi

volumul, care descriu starea curentă a sistemului. Energia internă, entalpia şi capacitatea calorică

sunt funcţii de stare. Proprietăţile legate de prepararea stării se numesc funcţii de drum. Lucrul

efectuat pentru prepararea unei stări, energia transferată sub formă de căldură sunt funcţii de drum.

Lucrul şi căldura sunt funcţii de proces. Exprimând acum matematic această afirmaţie,

avem:

ΔU = , dU diferenţială exactă; ΔH = , dH diferenţială exactă 12

2

1

UUdU −=∫ 12

2

1

HHdH −=∫

Prin diferenţială exactă înţelegem o mărime infinitezimală care prin integrare conduce la un

rezultat independent de drumul dintre starea iniţială şi finală. Astfel:

q = , dq diferenţială inexactă; w = , dw diferenţială inexactă ∫γ ]2,1[

dq ∫γ ]2,1[

dw

Prin diferenţială inexactă înţelegem o mărime infinitezimală care prin integrare conduce la un

rezultat care depinde de drumul dintre starea iniţială şi finală.

Fie o funcţie de stare f = f(x,y) şi z o altă funcţie de stare z = z(x,y). Avem:

xyf

yxf 22

∂∂∂

=∂∂

∂ ⇒ zxy

z

xy

z xy

yf

xf

x

dyyfdx

xf

xf

⎟⎠⎞

⎜⎝⎛∂∂

⋅⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂

+⎟⎠⎞

⎜⎝⎛∂∂

=

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂

+⎟⎠⎞

⎜⎝⎛∂∂

=⎟⎠⎞

⎜⎝⎛∂∂

zz xy1

yx

⎟⎠⎞

⎜⎝⎛∂∂

=⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂ ,

xyz zy

zx

yx

⎟⎠⎞

⎜⎝⎛∂∂

⋅⎟⎠⎞

⎜⎝⎛∂∂

−=⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂ , 1

xz

zy

yx

yxz

−=⎟⎠⎞

⎜⎝⎛∂∂

⋅⎟⎠⎞

⎜⎝⎛∂∂

⋅⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂

Următoarea relaţie ne spune dacă df = g(x,y)dx + h(x,y)dy este sau nu o diferenţială totală

(adică provine dintr-o funcţie de stare):

df = g(x,y)dx + h(x,y)dy diferenţială totală ⇔ yx x

hyg

⎟⎠⎞

⎜⎝⎛∂∂

=⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂

Primele studii asupra unei maşini termice care ar funcţiona după un ciclu format din patru

etape reversibile: (a) dilatare izotermă (T = TA); (b) dilatare adiabatică (q = 0); (c) comprimare

izotermă (T = TC); (d) comprimare adiabatică (q = 0), au fost efectuate de inginerul francez Sadi

Carnot. Se numeşte ciclu Carnot, un ciclu format din cele patru etape reversibile (a), (b), (c) şi (d).

Se numeşte maşină Carnot o maşină care ar funcţiona după un ciclu Carnot.

Exprimând lucrul şi energia în cele patru transformări, ţinând seama de evoluţia sistemului:

÷ ΔUAB = 0; qAB = -wAB; wAB = - ∫ ⋅B

-A

V

V

dVp =A

BA V

VlnnRT ⋅

÷ qBC = 0; wBC = - ∫ ⋅C

= ΔUBC; ΔUBC = CV(TC-TB) B

V

V

dVp

÷ ΔUCD = 0; qCD = -wCD; wCD = - ∫ ⋅D

-C

V

V

dVp =C

DC V

VlnnRT ⋅

÷ qDA = 0; wDA = - ∫ ⋅A

= ΔUDA; ΔUDA = CV(TB-TC) D

V

V

dVp

Ţinând cont că se defineşte randamentul unei maşini termice prin η=Lefectuat/qabsorbită,

exprimând randamentul pentru un ciclu Carnot, ciclu format din cele patru etape reversibile:

η = AB

CDAB

qww +

= AB

CDAB

qww +− =

AB

CDAB

qqq − = 1 -

AB

CD

qq =

A

BA

D

CC

VVlnT

VVlnT

1⋅

⋅− = 1-

A

C

TT

În expresia randamentului ciclului Carnot se poate observa că dacă temperatura sursei reci ar

fi 0K (TC = 0K) atunci randamentul este ηCarnot = 1 (perpetuum mobile de speţa a II-a). Condiţia ca

maşina Carnot să funcţioneze este ca TA > TC (pentru TC = TA ⇒ ηCarnot = 0).

Unele procese au loc natural, de la sine, altele nu. Un gaz se dilată pentru a umple volumul

disponibil, un corp cald se răceşte la temperatura mediului său înconjurător, iar o reacţie chimică

decurge de preferinţă într-o anumită direcţie.

Sensul transformărilor spontane este sensul care nu necesită efectuarea unui lucru pentru

realizarea procesului.

Se poate aduce un gaz la volum mai mic, se poate răci şi se pot aduce unele reacţii să

decurgă în sens invers (electroliza apei) dar nici unul dintre aceste procese nu are loc spontan;

fiecare se poate produce numai prin efectuarea unui lucru.

Distincţia între cele două tipuri de procese, spontane şi nespontane formează obiectul

principiului al doilea al termodinamicii: nu este posibil un proces al cărui unic rezultat este

absorbţia de căldură de la un rezervor şi transformarea sa completă în lucru. Într-un sistem izolat

sensul unui proces nu poate fi determinat de energia sa totală. Principiul I stabileşte că energia se

conservă şi nu se poate afirma că în orice proces sistemul tinde către o stare cu minim de energie,

deoarece într-un sistem izolat energia totală este constantă. Când are loc un proces, energia totală a

unui sistem izolat rămâne constantă, însă se distribuie în moduri diferite. Astfel, se poate corela

sensul de desfăşurare a proceselor cu modul de distribuire a energiei.

Astfel, procesele spontane sunt întotdeauna însoţite de o disipare a energiei într-o formă

mai dezordonată.

Principiul I a condus la introducerea energiei interne U. Energia internă ca funcţie de stare

ne permite să stabilim dacă un proces este posibil; într-un sistem izolat pot avea loc numai acele

procese (reprezentate în diagrama energetică U = U(T,V), de exemplu) în care energia internă

rămâne constantă (suprafaţa de energie internă U constantă). Principiul al II-lea care permite

aprecierea sensului proceselor spontane, poate fi formulat printr-o altă funcţie de stare, entropia S.

Entropia arată dacă o stare a unui sistem este accesibilă din alta în mod spontan. Într-un

sistem izolat entropia creşte în procesele spontane ΔStot > 0, unde ΔStot este entropia totală a

sistemului izolat care conţine sistemul de analizat. Definiţia riguroasă a entropiei se poate face pe

baza termodinamicii statistice.

Pornind de la diferite observaţii de natură experimentală, Ludwig Boltzmann a propus ca

formulă de calcul a entropiei ca grad de dezordine: S = k·lnW, unde k constanta Boltzmann şi W

numărul de moduri în care se poate rearanja energia sistemului prin rearanjarea atomilor şi a

moleculelor pe diferite stări accesibile. Din definirea entropiei pe baza relaţiei (6.3) rezultă şi

unitatea de măsură a ei: <S>SI = JK-1.

Relaţia dintre variaţiile de entropie în mediu şi entalpia de reacţie joacă un rol esenţial în

determinarea sensului transformărilor chimice spontane.

Un sistem în contact termic şi mecanic cu mediul său, dStot = dS + dS'. Evoluţia tuturor

proceselor în sistemul izolat format din sistemul observat şi mediul înconjurător este înspre

creşterea dezordinii: dStot ≥ 0; egalitatea dStot = 0 (păstrarea dezordinii totale constante) se petrece

pentru procesele reversibile (S - funcţie de stare) aşa încât: dS ≥ -dS', aşa încât: dS≥dq/T -

inegalitatea lui Clausius.

Se introduc alte două funcţii termodinamice de energie, numite potenţiale termodinamice:

÷ Energie liberă Helmholtz: A = U - TS;

÷ Entalpie liberă Gibbs: G = H - TS.

Din formula sa de definiţie dS = dqrev/T nu rezultă că entropia S este o funcţie de stare.

Pentru a demonstra acest fapt, trebuie să demonstrăm că:

∫γ ][

rev

Tdq = 0

Fie un ciclu Carnot. Căldura cedată (qc) şi absorbită (qa) se exprimă prin:

qc = C

DC V

VlnnRT ⋅ ; qa = A

BA V

VlnnRT ⋅

Variaţia de entropie pe traseul [ABCDA] este:

∫]ABCDA[

rev

Tdq = ∫

]AB[

rev

Tdq + ∫

]BC[

rev

Tdq + ∫

]CD[

rev

Tdq + ∫

]DA[

rev

Tdq =

A

a

T|q| -

C

c

T|q| = 0

În cazul general al unui proces reversibil, acesta poate fi descompus într-o serie de cicluri

Carnot, astfel:

∫γ ][

rev

Tdq = ∑ ∫

γ γi i ][

rev

Tdq = ∑

γ i

0 = 0

Variaţia entropiei cu temperatura este dată de:

ΔSAB = ∫]AB[

rev

Tdq

şi exprimă faptul că valoarea variaţiei entropiei într-un proces oarecare între stările A şi B se

regăseşte efectuând o transformare reversibilă între A şi B şi măsurând căldura necesară.

Se combină principiul I cu al II-lea, pentru a se obţine pentru o transformare reversibilă

următoarea relaţie:

dU = dqrev + dwrev; dwrev = -pdV; dqrev = TdS; dU = TdS - pdV

O observaţie foarte importantă este că valoarea dU este independentă de drum, deci

independentă de faptul că transformarea este reversibilă sau nu, aşa încât este adevărată pentru orice

tip de transformare. Această ecuaţie se numeşte ecuaţia fundamentală a termodinamicii.

Alegem acum alte două variabile de stare independente care să caracterizeze starea unui

sistem, S şi V. Exprimăm funcţia de stare U în raport cu acestea: U = U(S,V). În mod analog se

obţine:

dU = VS

U⎟⎠⎞

⎜⎝⎛∂∂ dS +

SVU⎟⎠⎞

⎜⎝⎛∂∂ dV

Prin simpla identificare de coeficienţi în ecuaţiile diferenţiale rezultă că la compoziţie

constantă (n = const.) avem:

VSU⎟⎠⎞

⎜⎝⎛∂∂ = T,

SVU⎟⎠⎞

⎜⎝⎛∂∂ = - p

Deoarece U este funcţie de stare, rezultă relaţiile lui Maxwell:

SVT⎟⎠⎞

⎜⎝⎛∂∂ = -

VSp⎟⎠⎞

⎜⎝⎛∂∂ ;

SpT⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂ =

pSV⎟⎠⎞

⎜⎝⎛∂∂ ;

VTp⎟⎠⎞

⎜⎝⎛∂∂ =

TVS⎟⎠⎞

⎜⎝⎛∂∂ ;

pTV⎟⎠⎞

⎜⎝⎛∂∂ = -

TpS⎟⎟⎠

⎞⎜⎜⎝

⎛∂∂

La T = 0 toată mişcarea termică este îngheţată şi într-un cristal perfect toate particulele sunt

dispuse într-o aranjare uniformă, regulată. Absenţa dezordinii spaţiale şi mişcării termice face ca S

= 0. Acest fapt este în acord cu formula Boltzmann, întrucât dacă W = 1 atunci

S = 0. Chiar dacă S ≠ 0 la T = 0, pentru o fază F a unei substanţe entropia sa SF(T) tinde la valoarea

sa minimă, SF(0). Acest fapt se poate exprima prin teorema calorică a lui Nernst:

Nernst: ΔS → 0 când T → 0

Formula Boltzmann şi teorema Nernst (7.26) pun bazele pentru formularea Principiului III:

Dacă entropia S a fiecărui element în starea sa cea mai stabilă la T = 0 se ia 0, atunci orice

substanţă are S ≥ 0 şi S = 0 pentru substanţele perfect cristaline (inclusiv compuşii).

O serie de programe soft au fost dezvoltate pentru modelarea structurii moleculare bazată pe

calcule de mecanică cuantică şi semiempirice, unele fiind în platformă open-source, altele free-to-

use, şi altele fiind comerciale:

÷ AMPAC (commercial);

÷ Cerius2 (commercial);

÷ Chem3D (commercial);

÷ Corina (commercial);

÷ deMon2k (free-to-use);

÷ GAMESS (open-source);

÷ GAUSSIAN (commercial);

÷ HyperChem (commercial);

÷ Insight II (commercial);

÷ Jaguar (commercial);

÷ MOE (commercial);

÷ MOLDEN (open-source);

÷ Molecular Modeling Pro (commercial);

÷ MOPAC (free-to-use);

÷ MPQC (open-source);

÷ NWChem (open-source);

÷ Octopus (open-source);

÷ PCModel (commercial);

÷ SCHRÖDINGER (commercial);

÷ Spartan (commercial);

÷ StoBe (commercial);

÷ Sybyl (commercial).

Chimie Medicală

Primele evidenţe de chimie medicală se găsesc în lucrarea lui Richet din 1893 [C R Seances

Soc Biol Fil 45:775-776]: care formulează prima relaţie lipofilicitate -activitate şi care observă

cantitativ că "plus ils sont solubles, moins ils sont toxiques";

Hansch printr-o serie de lucrări în perioada 1962-1964 pune bazele QSAR, aducând 3

contribuţii esenţiale pentru domeniu:

÷ combinarea mai multor parametrii fizico-chimici într-o singură ecuaţie de regresie;

÷ definirea parametrului de lipofilicitate π;

÷ Formularea modelului parabolic pentru relaţia neliniară între lipofilicitate şi activitatea

biologică;

Căile biosintetice pot fi controlate cu ajutorul inhibiţiei de reacţie inversă, ceea ce înseamnă

că produsul final al întregului lanţ metabolic inhibă activitatea primei enzime din lanţ (nu din genă).

Dacă prima reacţie nu mai are loc, enzimele următoare sunt "înfometate" de substrat, şi produsul

final nu mai este sintetizat. Produsul final se aşează pe prima enzimă într-o cavitate diferită de

cavitatea activă. Această a doua regiune se numeşte cavitate alosterică. Aşezarea efectorului

alosteric schimbă structura tridimensională a proteinei şi în special conformaţia cavităţii active.

Astfel, substratul nu se mai poate aşeza în cavitatea activă şi reacţia enzimatică este inhibată până

când inhibitorul de reacţie inversă nu părăseşte cavitatea alosterică.

Enzima

Cavitateaalosterică

Cavitatea activă

Legarea substratului

Are loc reacţia enzimatică

Substrat Efector alosteric

Datorită schimbării

conformaţionale a cavităţii active

reacţia enzimatică este inhibată

Nu se poate lega substratul

Absenţa reacţiei

enzimatice

Reacţia enzimatică

Metabolismul zaharurilor în organism este extrem de esenţial pentru viaţă. În figura

următoare este redat metabolismul glucozei:

anabolism

catabolism

glucogeneză

glicoliză

Dizaharide

Riboză-5-fosfat + NADPH + H+

Amidon (plante)

Glicogen (animale) Glucoză Piruvat Acetil-CoA

aerobic

Lactat

anaerobic, în muşchi

Etanol

anaerobic, în drojdie

ATP + NADH + H+ calea fosfogluconatului

Măsurarea proprietăţilor bilogice determină modalitatea de prelucrare şi interpretare a

datelor obţinute. Operaţia de măsurare se poate efectua doar cu ajutorul unei scări de măsură. Din

acest ultim unghi de vedere a problematicii măsurătorii rezultă că măsurătoarea este direct asociată

cu tipul scării de măsură. Aşa cum rezultă din ce expuse mai sus, cât de exactă este o măsurătoare

este la fel de important ca valoarea măsurătorii înseşi. Din acest motiv atunci când se exprimă

valoarea unei măsurători aceasta este însoţită de precizie, în diferite forme de exprimare ale

acesteia. Măsura referă o mărime supusă observaţiei. Din acest punct de vedere, mărimile se

clasifică în mărimi calitative şi mărimi cantitative.

O mărime este calitativă dacă pentru aceasta nu poate fi (sau cel puţin nu există) definită o

scară de valori cel puţin ordonată. Dacă scara de valori a unei mărimi admite o relaţie de ordine

(strictă) între elementele acesteia atunci mărimea este cantitativă.

Un exemplu. Să considerăm o mulţime cu 2 elemente în care ordinea elementelor nu este

relevantă: C = {a,b}. Mulţimea submulţimilor acestei mulţimi este SC = {{},{a},{b},{a,b}}. O

relaţie de ordine în mulţimea SC este definită prin numărul de elemente (cardinalitatea) al

submulţimii. Încă de la început să remarcăm că relaţia de ordine cardinalitate nu este o relaţie de

ordine strictă, existând două submulţimi cu acelaşi număr de elemente: |{a}| = |{b}| = 1. Relaţie de

ordine strictă există între 0 = |{}| < |{a}| = 1 = |{b}| < |{a,b}| = 2.

O întrebare se ridică acum: "Ce fel de scală de măsură defineşte cardinalitatea?" şi pentru a

afla răspunsul trebuie să ne întoarcem la observaţie şi anume să ne punem întrebarea "Ce

caracteristică se doreşte a fi evaluată?". Dacă răspunsul la această a doua întrebare este numărul de

elemente al submulţimii observate, atunci într-adevăr mărimea măsurată este cantitativă, având

submulţimea cu 0 elemente care este evident mai mică decât submulţimile cu 1 element şi care sunt

evident mai mici decât submulţimea cu 2 elemente. Dacă se doreşte diferenţierea submulţimilor

mulţimii C, atunci cu siguranţă că măsura cardinalitate nu este corect aleasă. Putem să ne

concentrăm atenţia (observăm) însă numai mulţimile cu exact 1 element, pentru care măsura

cardinalitate nu diferenţiază: {a} şi {b}. În acest caz ne aflăm într-o situaţie tipică de măsură

calitativă, exprimată prin "Submulţimea conţine elementul 'a'?", întrebare al cărui răspuns în

exemplul de mai sus este complementar cu răspunsul la întrebarea "Submulţimea conţine elementul

'b'?".

Exemplul de mai sus a arătat cel puţin că procedura de definire a unei scale de măsură

trebuie cel puţin verificată din punct de vedere al consistenţei, sau, dacă scala este deja definită

(cum a fost cazul cardinalităţii), se impune cel puţin verificarea consistenţei acesteia în raport cu

mărimea observată şi scopul urmărit. Mai mult, tot din exemplul de mai sus rezultă că chiar în

absenţa unei relaţii de ordine între valorile măsurate ({a} şi {b}) pot exista însă alte tipuri de relaţii

între valorile măsurate (în cazul de mai sus, este complementul logic, {a} = {a,b}\{b}; {b} =

{a,b}\{a}), ceea ce face ca valorile unei mărimi calitative să nu fie independente.

O scală de măsură este nominală dacă între valorile acesteia nu se poate defini o relaţie de

ordine. De aici rezultă că în mod uzual scala de măsură nominală este caracteristică mărimilor

calitative.

În cadrul scalelor de măsură nominale, un caz extrem de importantă este scala (de măsură)

binomială formată din doar două valori (între care nu există relaţie de ordine) cum ar fi: {Da, Nu},

{Viu, Mort}, {Vivo, Vitro}, {Prezent, Absent}, {Alcan saturat, Alt tip de compus}, {Număr întreg,

Număr neîntreg}.

O caracteristică extrem de importantă a scalelor nominale este că ele au un număr finit de

elemente (valori) şi aşa cum am observat şi în cazul mărimilor calitative indiferent de numărul

acestora, între ele există o legătură de complementaritate. Astfel, pentru o scală de măsură nominală

formată din grupele sangvine {0, A, B, AB} o valoare care este diferită de oricare 3 din cele 4

valori este cu siguranţă a 4-a dintre acestea. Scala de măsură nominală care nu este binomială se

mai numeşte şi scală de măsură multinomială.

O serie finită de valori poate să constituie o scală ordinală dacă elementele acesteia se află

într-o relaţie de ordine. Astfel, de exemplu valorile {Prezent, Absent} enumerate între exemplele de

scală binomială pot deveni scală ordinală dacă între valorile "Prezent" şi "Absent" se defineşte o

relaţie de ordine ("Absent" < "Prezent"). Alte astfel de exemple sunt "Fals" < "Adevărat", 0 < 1,

"Negativ" < "Nenegativ", "Nepozitiv" < "Pozitiv". Dintre exemplele de scale de măsură cu 3 valori

unul este imediat: "Negativ" < "Zero" < "Pozitiv".

Ceea ce deosebeşte suplimentar o scală ordinală de o scală nominală este faptul că nu este

necesar ca scala ordinală să fie formată dintr-un număr finit (sau cunoscut) de elemente. Este

necesar însă ca intre ele să existe o relaţie de ordine definită cel puţin printr-o funcţie "Succesor" al

unei valori şi complementul acesteia "Predecesor".

În scala interval distanţa între atribute are o semnificaţie. De exemplu la măsurarea

temperaturii, distanţa între 30° şi 40° este aceeaşi cu distanţa între 70° şi 80°. Intervalul între valori

este interpretabil (are o semnificaţie fizică). Acesta este motivul pentru care are sens să calculăm

media unei variabile de tip interval, ceea ce nu se aplică la scalele ordinale. Aşa cum 80° nu

reprezintă de două ori mai cald decât 40°, pe scalele interval nu are sens raportul a două valori.

În final, pe scala raport există totdeauna valoarea 0 care are semnificaţie. În mod evident

construcţia unei scale raport presupune că cea mai mică valoare care se poate observa este 0.

Aceasta înseamnă că întotdeauna se poate evalua raportul a două măsuri pe o scală raport, aceasta

fiind de asemenea o scală raport.

Este important de notat că calitatea unei scale de măsură nu dă şi acurateţea de măsură, sau

densitatea valorilor posibile ale unei variabile în jurul valorii măsurate. Astfel, chiar dacă frecvent

folosim ipoteza că o variabilă este continuă (între oricare două valori măsurate teoretic există cel

puţin încă o valoare) în practică se întâmplă deseori ca valoarea intermediară a cărei existenţă este

presupusă (sau demonstrată teoretic sau practic) să nu poată fi observată (măsurată) datorită

preciziei de care dispunem în măsură. Este de notat deci că tipul scalei de măsură nu dă şi caracterul

variabilei măsurate. Se pot la fel de bine măsura variabile discrete pe scale de măsură raport cum se

pot măsura şi variabilele continue.

Astfel, din punct de vedere al tipului scalei de măsură, o variabilă care numără moleculele

dintr-un set de date este "la fel de" variabilă raport ca o variabilă care măsoară temperatura la care

aceste molecule se află în mediul ambiant sau trec de la starea de agregare solidă la cea lichidă.

În tabelul 16 este redată o scară de măsură relativă (cu o singură referinţă), în care se

exprimă cantitatea de dulce a zaharurilor.

Tabelul 16. Cât de dulci sunt zaharurile Zahar Dulceaţă relativă la sucrozălactoză 0.16

galactoză 0.32 maltoză 0.33 sucroză 1.00 fructoză 1.73 aspartam 180 zaharină 450

În figura de mai jos este reprezentată entropia scalelor de măsură în termeni de organizare a

informaţiei.

Binare Nominale

Ordinale Interval

Raport

Figura exprimă o serie de proprietăţi ale scalelor de măsură. Astfel, mulţimea scalelor de

măsură binomiale este cea mai largă, cuprinzând scalele nominale. Demonstraţia acestui fapt este

uşor de făcut. Admiţând că avem la dispoziţie o scală nominală cu 3 categorii, atunci se pot defini

pe baza acesteia 3 scale binomiale, fiecare verificând apartenenţa măsurabilei la una din cele 3

categorii. Mulţimea scalelor ordinale este inclusă în mulţimea scalelor nominale. Admiţând că avem

la dispoziţie o scală ordinală, renunţând la relaţia de ordine deja am construit scala de măsură

nominală asociată. În mod identic, având la dispoziţie o scală interval, o putem segmenta pe aceasta

într-un număr arbitrar de subintervale şi cu ajutorul acestor subintervale construim una din scalele

ordinale asociate scalei interval.

O proprietate importantă rezultă din incluziunea scalelor de măsură, şi anume incluziunea

instrumentelor statistice (testelor statistice) cu pe care le avem la dispoziţie să caracterizăm sau

investigăm mărimile măsurate. Presupunând că am înregistrat valorile variabilei X cu o scală de

măsură atunci toate statisticile care se pot aplica variabilei X în ipoteza că a fost măsurată cu o scală

de măsură care o conţine pe cea utilizată, se aplică în egală măsură şi observaţiei cu scala de măsură

utilizată, care, desigur, oferă în plus o serie de statistici care nu se aplică decât acestei scale şi celor

pe care le include.

La fiecare nivel de incluziune, nivelul curent include deci toate calităţile ale mulţimilor mai

mari şi aduce ceva în plus, reducând entropia scalei de măsură. În mod evident, totdeauna este de

dorit ca în observarea unei variabile să se folosească acea scală de măsură care înglobează cele mai

multe caracteristici pe care variabila observată le prezintă, cum tot atât de important (sau mai

important) este ca anumite atribute pe care le produce scala să fie proprii variabile şi să nu fie create

în mod artificial de măsură, în caz contrar scala de măsură devenind o sursă de eroare.

O serie de baze de date cumulează evidenţe de chimie medicală. Grupate pe categorii,

acestea sunt:

÷ Conţinând date de efect biologic:

÷ AmicBase;

÷ Biocatalysis/Biodegradation DB;

÷ Carcinogenic Potency Project;

÷ ChemBank;

÷ Drug Data Report DB;

÷ EDKB;

÷ FDA Toxicity DBs;

÷ ISS Chemical Carcinogens;

÷ Leadscope Toxicity DB;

÷ NIH NIEHS National Toxicology Program;

÷ NIH NCI DBs (CambridgeSoft, CCC, MDL, DayLight);

÷ Prous Science DBs;

÷ PubChem;

÷ RTECS (MDL, NIOSH);

÷ US EPA DSSTox;

÷ Vitic;

÷ Conţinând biopolimeri:

÷ ASEdb;

÷ 3DID;

÷ BID;

÷ BOND;

÷ BRITE;

÷ DIP;

÷ EMPIRE;

÷ GRID;

÷ iHOP;

÷ IntAct;

÷ InterDom;

÷ KDBI;

÷ MiMI;

÷ MINT;

÷ MPPI;

÷ NuRISITE;

÷ Orientation of Proteins in Membranes;

÷ POINT;

÷ ProtCom;

÷ SNAPPI-DB;

÷ SPIN-PP;

÷ STRING;

÷ UniHI;

÷ Domain Motions;

÷ molmovdb;

÷ ProMode;

÷ PCDDB;

÷ PPD;

÷ Conţinând compuşi chimici şi medicamente:

÷ Available Chemicals Directory (DayLight);

÷ Cambridge Structural DB;

÷ CCCBDB;

÷ CenterWatch;

÷ Drug Directories;

÷ ChemDB;

÷ ChemExper;

÷ ChemFinder;

÷ ChemIDPlus;

÷ chEBI;

÷ ChEMnetBASE;

÷ ClogP of Selected Drugs;

÷ Comprehensive Medicinal Chemistry DB;

÷ CSLS;

÷ Cyberlipid Center;

÷ DrugBank;

÷ Drug Data Report;

÷ Data & Property Calculation Websites;

÷ EPA Chemical Registry System;

÷ ESIS;

÷ FDA Databases;

÷ FDA Toxicity Databases / Leadscope;

÷ FooDBank;

÷ Handbook of Chemistry and Physics;

÷ Henry's Law Constants;

÷ Investigational Drugs DB;

÷ iResearch;

÷ Landolt-Börnstein;

÷ LDB;

÷ Leadscope Known Drugs;

÷ Ligand.Info;

÷ LiqCryst;

÷ LogKow;

÷ MDPI;

÷ MedChem;

÷ Merck Index;

÷ Metabolite DB;

÷ NIST Online DBs (Gateway);

÷ NLM SIS;

÷ NCI DIS 3D DB;

÷ Organic Compounds DB;

÷ PhRMA New Medicines DB;

÷ PhysProp DB;

÷ Screening Compounds Directory;

÷ SickList;

÷ Solubility DB (IUPAC-NIST);

÷ SRC Pointer File;

÷ Stability Constants DB (IUPAC);

÷ Super Drug Database;

÷ World Drug Index (DayLight);

÷ ZINC;

÷ Conţinând date de mediu:

÷ ATSDR HazDat Database;

÷ Environmental Fate DB;

÷ Environmental Fate of Chemicals;

÷ US EPA's IRIS;

÷ Pesticide DB;

÷ U.S. EPA TSCA (Cornell, DayLight, SRC);

÷ Conţinând afinităţi de legătură:

÷ AffinDB;

÷ BindingDB;

÷ Binding MOAD;

÷ ChemBank;

÷ DLRP;

÷ KiBank;

÷ PDBbind;

÷ PDSP Drug Ki DB;

÷ PubChem;

÷ SCORPIO (structure-calorimetry);

÷ SMID;

÷ WOMBAT;

÷ eF-site;

÷ LigBase;

÷ MSDsite;

÷ PDBSite;

÷ PINTS;

÷ PRECISE;

÷ pvSOAR;

÷ Relibase;

÷ sc-PDB;

÷ SitesBase;

÷ SMIDSuite;

÷ SuMo;

÷ Super Ligands;

÷ Conţinând structuri şi proprietăţi ligand-receptor:

÷ BioMagResBank;

÷ CAZy;

÷ FireDB;

÷ IceDB;

÷ IMB;

÷ LPC/CSU;

÷ Luna;

÷ Macromolecular Structures DB (till 1999);

÷ mmdb;

÷ MSD;

÷ NDB;

÷ NIH CMM Links;

÷ nrpdb;

÷ OCA;

÷ PDB;

÷ PDBj;

÷ PDBSelect;

÷ PDBsum;

÷ Planet;

÷ PRECISE;

÷ PROCAT;

÷ RCSB DBs;

÷ RECOORD;

÷ SCOP;

÷ Side-Chain Interactions;

÷ SPIN-PP;

÷ STING Millenium Suite;

÷ wwPDB;

÷ XPDB;

÷ Conţinând date de QSAR şi toxicogenomică:

÷ MedChem QSAR DB;

÷ ArrayExpress;

÷ ArrayTrack;

÷ Chemical Effects in Biological Systems.

Analiza rezultatelor obţinute şi interpretarea rezultatelor

Grassy şi alţii în 1998 în lucrarea [Computer Assisted Rational Design of

Immunosuppressive Compounds, Nature Biotechnol 16:748-752] raportează căutarea de pepdide

posedând activitate imunosupresivă. Aceştia au utilizat 27 descriptori de proprietate (12 descriptori

de chimie matematică şi 15 descriptori de chimie cuantică). S-a generat o librărie combinatorială cu

280000 de compuşi după care s-au selectat 26 de peptide pentru care o înaltă activitate a fost prezisă

cu ajutorul descriptorilor. 5 dintre aceste peptide au fost sintetizate şi testate experimental. Cea mai

potentă dintre acestea a arătat o activitate imunosupresivă de aproximativ 100 de ori mai mare decât

compusul de referinţă.

Problema integrării informaţiilor de natură cuantică (geometria moleculară) cu cele de

natură matematică (topologia moleculară) în prezicerea activităţilor biologice (chimia medicală)

este o problemă dificilă şi analiza şi interpretarea rezultatelor necesită implementarea de algoritmi

meta-euristici.

Lamarck (Lamarck, 1809) după eforturi extraordinare de clasificare a organismelor vii,

remarcă că atât în ceea ce priveşte animalele (studiind mai cu seamă animalele nevertebrate) cât şi

plantele clasificarea pe specii şi varietăţi este mai mult sau mai puţin arbitrară, aducând numeroase

argumente în acest sens. Făcând apel la taxonomia modernă, astăzi sunt recunoscute 5 domenii, care

mai apoi se subîmpart pe divizii, clase, ordine, familii, genuri şi specii. Însă studiile lui Lamarck

despre specii rămân de o deosebită importanţă, în ciuda faptului că explicaţia pe care a găsit-o

Lamarck asupra observaţiilor sale bazată pe superstiţiile vremii şi anume că golurile constatate în

schema de clasificare a speciilor ar fi în fapt datorată dispariţiei acestora a fost contrazisă ulterior de

studiile lui Darwin (Darwin, 1859). Chiar şi Darwin a fost influenţat de concluziile la care a ajuns

Lamarck, aşa cum nota Fisher în 1954 (Fisher, 1954). Realizările majore ale epocii de început a

geneticii sunt completate de studiile de încrucişare de varietăţi ale lui Mendel (Mendel, 1866)

stabileşte legile care astăzi îi poartă numele, formularea teoriei moştenirii dure care vine să

completeze elementele lipsă lăsate de predecesori (Weismann, 1893), şi în final studiile pe

musculiţa de oţet ale lui Morgan (Morgan, 1915) în urma cărora acesta elaborează teoria

cromozomială a moştenirii, care este şi astăzi la baza geneticii moderne. Nu în ultimul rând se

menţionează studiile de o deosebită valoare ştiinţifică ale lui Fisher (Fisher, 1918; Fisher, 1922),

care a adus argumente ştiinţifice de necontestat (chiar dacă la vremea când acestea au fost scrise de

către Fisher au fost din plin contestate, aşa cum se poate desprinde şi din fragmentele alese pentru

exemplificare) cu privire la originea speciilor şi teoria evoluţionistă.

Rezumând, moştenirea dură (Weismann, 1893) şi uşoară (Lamarck, 1809), selecţia şi

supravieţuirea (Darwin, 1859), genele şi încrucişarea genelor (Morgan, 1915) şi caracterelor

(Mendel, 1866) îndelung dezbătute şi disputate de-a lungul secolului 19 (Fisher, 1954) constituie

toate piese dintr-un puzzle care construieşte astăzi genetica modernă (Ayala şi alţii, 1994), şi

reprezintă sursele de inspiraţie ale algoritmilor genetici.

Primele simulări ale evoluţiei se regăsesc în studiile lui Nils Aall BARRICELLI (Barricelli,

1954). Puţin timp mai târziu, Alex FRASER (1923-2002) a publicat o serie de lucrări despre

simularea selecţiei artificiale a organismelor cu locuşi multipli ce controlează o trăsătură

măsurabilă. Simulările lui Fraser (Fraser, 1957-1970) includ toate elementele esenţiale ale

algoritmilor genetici moderni.

Uzual, în viaţa noastă de zi cu zi la fel ca şi în cercetarea ştiinţifică noi operăm cu probleme.

În informatică şi ramurile derivate ale acesteia (cum e cazul bio-informaticii şi chemo-informaticii)

o problemă are o semnificaţie precisă, foarte apropiată cu cea de algoritm. Un algoritm este în

esenţă o reţetă specificând ce să facem în anumite condiţii pentru a obţine un anumit obiectiv. Un

algoritm necesită două resurse pentru a rezolva o problemă, şi anume timp (cu sensul de timp de

execuţie, mărime corelată cu numărul de instrucţiuni elementare) şi spaţiu (pentru stocarea datelor

de intrare şi a variabilelor).

Nu toate problemele sunt de aceeaşi complexitate şi acelaşi lucru este valabil şi pentru

algoritmii de rezolvare. Astfel, unele probleme au complexitate exponenţială, ceea ce înseamnă că

cel mai bun algoritm rezolvă problema într-un timp de execuţie ce creşte exponenţial în funcţie de

dimensiunea (volumul, mărimea) datelor de intrare. Acest tip de probleme sunt numite dificile,

deoarece chiar şi cel mai bun algoritm (care există sau ar putea exista) va fi probabil nepractic cu

date de intrare din practică (Falkenauer, 1998).

Dacă o problemă este dificilă, atunci căutarea optimului frecvent iese în afara timpului

disponibil pentru aplicaţiile reale. Chiar dacă există această problemă, există totuşi o serie de

probleme întâlnite în practică când obţinerea optimului nu este necesară (obligatorie). De cele mai

multe ori o soluţie bună este suficientă.

În concluzie, căutarea pentru algoritmi de aproximare buni este perfect legitimată, chiar dacă aceşti

algoritmi nu garantează atingerea optimului global pentru orice instanţă cu care sunt hrăniţi, dar

care produc soluţii aproape de soluţia optimă.

Deoarece cele mai multe probleme dificile au fost împrejurul nostru de foarte mulţi ani,

pentru o varietate de probleme dificile unul sau mai mulţi euristici au fost deja concepuţi. Aceştia

sunt seturi de reguli gândite pentru a rezolva o problemă anume, uzual bazaţi pe bunul simţ (în ceea

ce priveşte soluţia aşteptată) prin evitarea erorilor grosolane, dar care nu sunt gândiţi pentru a

produce totdeauna soluţia cu exactitate şi respectiv să fie capabili să producă o soluţie pentru orice

valori de intrare.

Chiar dacă cei mai mulţi euristici sunt foarte mult ad-hoc şi dependenţi de problema dată,

odată cu dezvoltarea informaticii cercetătorii au reuşit să formuleze trei euristici care sunt foarte

generali, şi anume aplicabili la o mare varietate de probleme dificile. Din cauza acestei generalităţi

pe care o posedă, aceştia au căpătat numele de meta-euristici. Toţi trei sunt stocastici [a fi stocastic:

Implicând sau conţinând una sau mai multe variabile aleatoare, implicând şansa sau probabilitatea] în natura

lor, doi dintre aceştia (SA şi GA) fiind bazaţi pe procese naturale care au loc în jurul nostru din

totdeauna. Împreună cu călirea simulată (în engleză SA - Simulated Annealing; van Laarhoven and

Aarts, 1987; Davis, 1987) şi căutarea tabu (în engleză TS - Tabu Search; Glower, 1977 şi 1986;

Glover şi alţii, 1992) sunt şi algoritmii genetici (în engleză GA - Genetic Algorithm).

Primele studii în care au apărut algoritmii genetici se găsesc în anul 1954, însă studii de

amploare ale acestora au apărut după 1970 (Bosworth şi alţii, 1972; Holland, 1975) şi au fost re-

inventaţi ceva mai târziu (Davis, 1991, Holland, 1992).

Înainte de a defini ceea ce este un algoritm genetic, să definim mai întâi prin ce evaluează

calitatea unul algoritm euristic. Sunt trei criterii care trebuie considerate:

÷ viteza: cât de repede obţine soluţia;

÷ precizia: cât de departe de află acea soluţie de optimul global;

÷ scopul: cât de mare este subsetul datelor de intrare în raport cu setul tuturor valorilor posibile

pentru care algoritmul performează în raport cu anterioarele două criterii;

O problemă importantă legată de complexitatea algoritmică este reprezentată de teorema

inexistenţei mesei pe gratis (în engleză NFLT - No Free Lunch Theorem; Wolpert and Macready,

1995 şi 1997), teoremă care utilizând aceste trei criterii de mai sus arată că toţi algoritmii sunt strict

echivalenţi, ceea ce înseamnă că pentru doi algoritmi A şi B, pentru fiecare set de date pentru care

A performează mai bine decât B există un set de date pentru care B performează mai bine decât A.

Interpretarea simplă care se dă acestei teoreme în termeni comuni şi anume că oricât ai încerca să-ţi

faci algoritmii tăi mai isteţi, este un efort în van deoarece ei vor performa la fel ca orice alt algoritm,

nu este una corectă. Ceea ce teorema într-adevăr spune este că dacă se mediază performanţele

tuturor algoritmilor pe toate datele posibile, atunci ei vor performa la fel. Revenind la termeni

comuni, şmecheria este desigur să nu încerci să hrăneşti toţi algoritmii pe care îi realizezi pe toate

datele cu putinţă, ci să încerci să îţi dedici algoritmul la un domeniu de aplicabilitate, şi aici să iei

în considerare şi să valorifici prin implementare în algoritm orice structură specială este posibil să

existe în datele cu care intenţionezi să hrăneşti algoritmul. De aici rezultă că scopul algoritmului

care performează bine trebuie să fie restrâns la setul de date care prezintă structurile speciale

identificate.

Următoarele categorii de probleme pot fi subiect de rezolvare pentru algoritmii genetici:

÷ Probleme de decizie

o O problemă de decizie este definită pentr-o întrebare cu răspuns de tipul da/nu pe un

set (infinit) de date de intrare; din acest motiv problemele de decizie sunt echivalente

cu obţinerea setului de date de intrare pentru care răspunsul problemei este da.

Problemele de decizie sunt legată de problemele de optimizare atâta timp cât

problema este obţinerea celui mai bun răspuns la problemă.

÷ Probleme de clasificare

o O problemă de clasificare pentru obiecte dintr-un domeniu dat

este în separarea acestor obiecte în clase mai mici, şi producerea

de criterii de determinare dacă un obiect anume dintr-un

domeniu este într-o anume clasă sau nu. Una dintre cele mai

faimoase probleme de clasificare este problema formulată de

Carl LINNAEUS (23 Mai 23 1707 - 10 Januarie 10 1778) a

clasificării vieţuitoarelor după clase, ordine, genuri şi specii

(Linnaei, 1735).

÷ Probleme de optimizare

o O problemă de optimizare este o problemă de găsire a celei mai bune soluţii dintre

toate soluţiile posibile. În mod formal, o problemă de optimizare este un cvadruplu

(I,f,m,g) unde:

I - set de instanţe;

f(·) - setul soluţiilor posibile definite pe I;

m(·,·) - măsura definită pe produsul soluţiilor posibile şi instanţelor

g - min. sau max. - funcţia obiectiv

scopul este găsirea optimului lui x: m(x,f(x))=g{m(y,f(y), y ∈I}

o Pentru fiecare problemă de optimizare există o problemă de decizie care este asociată

şi a cărei întrebare este dacă există o soluţie posibilă pentru o anumită măsură m0.

÷ Probleme de simulare

o Simularea este imitarea unui fapt real, unei stări de fapt, sau a unui proces. Actul

simulării a ceva în general implică reprezentarea unor anumite caracteristici sau

comportamente cheie ale unui sistemul fizic sau abstract. Simularea este folosită în

multe contexte incluzând modelarea sistemelor naturale, pentru a pătrunde

funcţionalitatea acestora. Elementele cheie în simulare includ achiziţia unei surse

valide de informaţie despre subiectul de studiu, selecţia caracteristicilor şi

comportamentelor cheie, utilizarea de aproximaţii şi presupuneri simplificatoare în

cadrul simulării, şi evaluarea fidelităţii şi validităţii rezultatelor simulării.

Algoritmii genetici sunt algoritmi de căutare euristici adaptivi bazaţi pe ideile teoriei

evoluţiei şi anume aduce conceptele de selecţie naturală şi genetică în arena simulării matematice cu

ajutorul calculatorului. Mimica proceselor observate în evoluţia naturală a materiei organice în

general serveşte drept instrument algoritmilor genetici în scopul de a rezolva probleme de decizie,

clasificare, optimizare şi simulare. Elementele cheie la care se face apel în algoritmii genetici sunt:

÷ Modelul genetic (dualismul genotip - fenotip) aşa cum a fost el formulat şi argumentat încă de la

primii paşi ai geneticii (Morgan, 1915; Fisher, 1918);

÷ Încrucişarea (dualismul caractere - gene) aşa cum a fost ea observată încă de la precursorii

geneticii moderne (Lamarck, 1830; Mendel, 1865; Weismann, 1893);

÷ Mutaţia, aşa cum a fost ea observată încă de la precursorii geneticii moderne şi până în zilele

noastre:

o întâmplătoare (De Veies, 1902);

o deliberată prin expunerea la anumite condiţii (Patterson, 1928; Auerbach şi alţii, 1947);

o sub presiunea factorilor de mediu: (Cains şi alţii, 1988);

÷ Selecţia naturală sau "supravieţuirea celui mai tare" (Darwin, 1859).

Construcţia algoritmilor genetici.

Algoritmii genetici se materializează sub forma de programe evolutive şi sunt simulări pe

calculator în care:

(spaţiul de căutare)

÷ Se operează asupra unei populaţii de reprezentări abstracte numite (după elementele genetice pe

baza cărora au fost imaginate) cromozomi sau genotipuri ale unui genom, la rândul său fiecare

reprezentare abstractă a unui cromozom fiind compusă din gene.

··· ··· ··· ···

genă cromozom genom

Spaţiul de căutare al unui algoritm genetic

÷ Fiecare generaţie este compusă dintr-o populaţie de şiruri de caractere (sau alte forme de

reprezentare abstractă) analog cu cromozomii ADN-ului. Fiecare element al populaţiei

reprezintă un punct în spaţiul de căutare şi în acelaşi timp o soluţie posibilă.

÷ Ceea ce Figura 1 reprezintă formal, şi anume spaţiul de căutare al unui algoritm genetic, poate

avea multe variante de implementare, trei dintre ele fiind următoarele:

o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile formulate în

sistemul S (în engleză: S-system formalism, Savageau, 1976) care este un tip de formalism

derivat din modelul de proces al reacţiilor stoechiometrice cu pre-echilibru (ΣiRi ↔ ΣjIj →

ΣkPk, unde Ri reactanţi, Ij intermediari, Pk produşi ai unei reacţii în care constantele de

proces - constantă de viteză şi ordine parţiale de reacţie - sunt necunoscute şi se doresc a fi

determinate), atunci următoarea este o posibilă implementare:

O genă: o constantă (un ordin parţial sau o constantă de viteză de reacţie) subiect al

găsirii (optimizării);

Un cromozom: o posibilă cale de desfăşurare a reacţiei, având specificate toate ordinele

parţiale şi constantele de viteză specificate;

Genomul: toate căile de desfăşurarea a reacţiei prezente într-o iteraţie a algoritmului

genetic;

o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile de aliniament de

secvenţe genetice (Notredame şi Higgins, 1996) de ADN, ARN sau proteine în scopul

identificării regiunilor de similaritate care pot fi sursă de relaţii structurale, funcţionale sau

evolutive între secvenţe, atunci următoarea este o implementare posibilă:

O genă: două (sau mai multe) poziţii corespunzătoare la două (sau mai multe) sub-

secvenţe aliniate (sau mai exact pseudo-aliniate) şi lungimea aliniamentului acestora;

Un cromozom: o posibilitate de aliniament pentru cele două (sau mai multe) secvenţe;

Genomul: toate posibilităţile de aliniament de secvenţe stocate într-o iteraţie a

algoritmului genetic;

o Dacă algoritmul genetic are ca scop o problemă de setare în managementul efectuat în

scopul maximizării randamentului de producţie în câmp (Liu şi alţii, 2001), o problemă

dificilă de setare a parametrilor controlabili (sau alteori predictibili) pentru obţinerea unei

productivităţi maxime, atunci următoarea este o implementare posibilă:

O genă: una dintre următoarele: pH-ul solului, fertilizatori în termeni de cantitate de N,

P şi K, cantitatea de materie organică din sol, gradul de creştere termică zilnică (o

mărime medie între temperatura minimă şi maximă a zilei), potenţialul genetic (ce poate

fi exprimat în termeni de randament care s-ar obţine dacă vremea, solul şi fertilitatea

sunt toate optime), cantităţile de precipitaţii pe perioada de maximă vegetaţie pe lunile

Mai, Iunie, Iulie şi August, densitatea de plantare şi factorul de rotaţie;

Un cromozom: o stare de fapt care poate apare în practică în câmp;

Genomul: toate stările de fapt stocate într-o iteraţie a algoritmului genetic;

(selecţia şi supravieţuirea)

÷ Un scor sau şansă de supravieţuire a fiecărei soluţii este calculată pentru fiecare genotip cu

ajutorul unei funcţii, numită şi funcţie obiectiv. Valoarea acestei funcţii este asociată cu

abilitatea individului să supravieţuiască şi defineşte astfel fenotipul asociat genotipului.

ADN plantă cultivar

decodare mediu

codare

genotip fenotip supravieţuire

Selecţia: genotip, fenotip şi supravieţuire

÷ Dacă fiecare genotip reprezintă un punct în spaţiul de căutare şi în acelaşi timp o soluţie

posibilă, prin intermediul selecţiei genotipul este concretizat în fenotip (operaţie care iterează

reprezentarea soluţiilor posibile în spaţiul soluţiilor şi evaluează valoarea acestora). Principiul

selecţiei naturale se exprimă astfel:

o Indivizii (fenotipurile) din populaţie concurează pentru supravieţuire (selecţie).

o Genele indivizilor selectaţi se propagă de la o generaţie la alta (datorită selecţiei);

o Fiecare generaţie devine mai potrivită mediului în care se află (prin penalizarea indivizilor

care eşuează a supravieţui).

÷ Scorul este asociat fiecărui fenotip (soluţie) reprezentând abilitatea acestuia să concureze pentru

resurse în mediu, pentru supravieţuire (selecţie). Scopul algoritmului genetic este ca să aplice

încrucişarea şi mutaţia selectivă a fenotipurilor (prin intermediul decodării lor în genotipurile

din care provin) pentru a produce descendenţi mai buni decât părinţii lor.

÷ Algoritmul genetic menţine un cultivar (un eşantion de populaţie) de un număr dat (sau uneori

variabil) de genotipuri a căror selecţie se poate face aplicând acelaşi operator. Astfel, selecţia şi

supravieţuirea sunt două concepte asociate. Selecţie se face pentru operaţiile de încrucişare şi

mutaţie, şi selecţie se face şi pentru supravieţuire în populaţia limitată de fenotipuri.

÷ Prin selecţie o parte din indivizii populaţiei mor şi sunt înlocuiţi de alţii. În acest mod se speră

că de-a lungul generaţiilor soluţii mai bune vor răsări în timp ce cele mai slabe soluţii sunt

înlăturate. Odată cu trecerea de la o generaţie la alta populaţia va conţine din ce în ce mai bune

soluţii decât generaţia anterioară.

şir soluţie

decodare funcţie

obiectiv codare

valoare

÷ În tabelul următor (Tabelul 17) este redată legătura care se stabileşte între scorul (exprimat prin

funcţia Fitness(·) în tabel) şi regula de selecţie în funcţie de metoda (aşa cum este ea cunoscută

în literatura de specialitate) folosită.

Tabelul 17. Scor şi selecţie în algoritmii genetici

Metodă Expresia funcţiei de scor Selecţie Comentarii Proporţional pi=fi/Σifi Şansa de selecţie este proporţională cu

scorul (utilizând probabilitatea pi în selecţie)

Deterministic i | fi = max. sau min.

Selecţia indivizilor este făcută pe baza celui mai tare (sau celui mai slab) individ (elitism)

Turnir

fi=Fitness(Cromozom_i)

(fi,fj) max. sau

min.

Perechi de indivizi concurează între ei pentru selecţie (din nou cel mai tare sau cel mai slab)

Normalizare gi=(fi-N0)(fmax.-fmin.)/(N1-N0)

pi=gi/Σigi O scală fixă [N0,N1] normalizează scorul fenotipurilor între generaţii diferite

Ranguri hi=Rank(fi)(fmax.-fmin.)/Size pi=hi/Σihi Şansa este proporţională cu rangul scorului unde: Rank(·): rangul; Size: volum genom

÷ Ceea ce se reprezintă formal, şi anume selecţia şi supravieţuirea fenotipurilor poate avea multe

variante de implementare, trei dintre ele fiind următoarele:

o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile formulate în

sistemul S (Savageau, 1976), atunci următoarea este o posibilă implementare:

Şirul, corespunzător unui genotip: o listă de valori constante subiect al optimizării şi

asociat cu un experiment virtual;

Soluţia, corespunzătoare genotipului (şi cromozomului): seria de timp a elementelor

experimentului virtual (pentru o reacţie chimică prin soluţie se înţeleg seriile de timp ale

concentraţiilor reactanţilor, intermediarilor şi produşilor de reacţie pe parcursul

desfăşurării reacţiei);

Valoarea, corespunzătoare scorului: suma pătrată a diferenţelor dintre valorile observate

(ca serie sau serii de timp) şi valorile estimate (de fenotip) ale uneia (sau mai multor)

observabile (cum ar fi concentraţie sau concentraţii de intermediari);

o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile de aliniament de

secvenţe de aminoacizi (Notredame şi Higgins, 1996), atunci următoarea este o posibilă

implementare:

Şirul, corespunzător unui genotip: o listă de perechi (sau de mai multe) poziţii de sub-

secvenţe aliniate urmată de lungimea fiecărei sub-secvenţe;

Soluţia, corespunzătoare fenotipului (şi genotipului): o serie de valori conţinând poziţii

de rupere şi lungimi de translatare necesare pentru a alinia secvenţele;

Valoarea, corespunzătoare scorului: o funcţie de scor dând (uzual sub forma unei sume)

costul total pentru toate ruperile şi deplasările necesare pentru a alinia secvenţele,

utilizând un cost predefinit pentru o rupere şi pentru deplasarea unei unităţi în secvenţă;

o Dacă algoritmul genetic setarea parametrilor necesari pentru obţinerea unei bune producţii

în câmp (Liu şi alţii, 2001), atunci următoarea este o posibilă implementare:

Şirul, corespunzător unui genotip: o listă de valori ce corespund unui experiment virtual

şi constituie obiect al optimizării; Valorile din şir pot fi: pH-ul solului, fertilizatori în

termeni de cantitate de N, P şi K, cantitatea de materie organică din sol, gradul de

creştere termică zilnică (o mărime medie între temperatura minimă şi maximă a zilei),

potenţialul genetic (ce poate fi exprimat în termeni de randament care s-ar obţine dacă

vremea, solul şi fertilitatea sunt toate optime), cantităţile de precipitaţii pe perioada de

maximă vegetaţie pe lunile Mai, Iunie, Iulie şi August, densitatea de plantare şi factorul

de rotaţie;

Soluţia, corespunzătoare fenotipului (şi genotipului): un şir de valori caracterizând

soluţia, cuprinzând valori obţinute prin aplicarea de funcţii care să exprime: calitatea

solului, calitatea vremii, managementul de cultivare, potenţialul genetic şi efectul unor

evenimente întâmplătoare;

Valoarea, corespunzătoare scorului: suma pătratelor diferenţelor între randamente

observate (în serii de experimente anterioare) şi estimate (de fenotip) ale randamentelor;

(încrucişarea şi mutaţia)

÷ Încrucişarea reprezintă împerecherea între fenotipuri; fenotipurile (uzual două) sunt selectate

din populaţie folosind operatorul de selecţie; o porţiune de încrucişat de-a lungul şirului de gene

ale genotipurilor asociate fenotipurilor este aleasă (întâmplător sau deterministic) şi valorile

celor două porţiuni de şiruri sunt schimbate între ele, rezultând astfel din această împerechere

doi descendenţi care sunt direct selectaţi pentru a face parte din noua generaţie de populaţie;

încrucişarea este făcută în speranţa că dacă se recombină porţiuni de genotipuri de succes,

atunci acest proces este probabil să producă descendenţi chiar mai buni decât părinţii din care

provin;

O încrucişare dublă implicând ruperea şi reunirea cromozomilor părinţilor

··· ··· ···

··· ··· ···

site încrucişare

··· ··· ···

··· ··· ···

părinţi

copii recombinare

··· ···

Mutaţia

÷ Mutaţia este operatorul care introduce modificări noi (inexistente în populaţia unei generaţii);

ceea ce este caracteristic în general mutaţiei şi implicit şi operatorului acesteia corespondent în

algoritmii genetici este că ea se petrece cu o probabilitate scăzută, fiind deci aplicată cu o

probabilitate scăzută (cu probabilitatea de 1/8 în figura de mai sus); operatorul de mutaţie poate

implementa o mutaţie:

o Întâmplătoare: când o porţiune a unui individ selectat va suferi schimbarea valorilor stocate

în genele sale cu alte valori existente în materialul genetic al populaţiei şi are rolul

menţinerii diversităţii în populaţie pentru a preveni populaţia să prezinte o convergenţă

prematură;

o Deliberată: când expunerea la anumite condiţii se transpune în folosirea unei reguli

predeterminate de modificare a valorilor genelor;

o Sub presiunea factorilor de mediu, când valorile genelor se schimbă în raport cu scorul

fenotipului supus modificării genetice;

(evoluţia)

÷ Utilizând doar selecţia singură un algoritm nu va reuşi decât să copieze (cloneze) cel mai bun

individ (fenotip) al său în întreaga populaţie;

÷ Utilizând mutaţia singură un algoritm va reuşi doar să inducă parcurgerea întâmplătoare a

spaţiului de căutare;

÷ Utilizând încrucişarea şi selecţia un algoritm va reuşi să conveargă către o soluţie bună dar nu

sub-optimală (în apropierea celei optime);

÷ Mutaţia şi selecţia (fără încrucişare) într-un algoritm creează algoritmi paraleli, toleranţi la

perturbaţii în căutarea de puncte de maxim local (în terminologia în engleză: hill-climbing);

÷ Utilizarea tuturor operatorilor (mutaţie, încrucişare si selecţie) asigură unui algoritm toate

caracteristicile de definire ale unui algoritm genetic;

··· ···

mutant

părinte

descendenţi

Schema ilustrativă a modului de lucru al unui algoritm genetic clasic

÷ Într-un algoritm genetic clasic (de genul celui ilustrat), pentru a rezolva o problemă, se

generează întâmplător sau se iniţiază cu valori predefinite o populaţie de un volum dat de

genotipuri; cerinţele preliminare algoritmului genetic este existenţa funcţiei obiectiv cu ajutorul

căreia se evaluează scorul unui fenotip în populaţie; algoritmul genetic iterează astfel:

o Repetă

Pasul_1: Utilizând operatorul de selecţie selectează doi cromozomi;

Pasul_2: Utilizând o funcţie discretă de probabilitate pentru alegerea porţiunii de

încrucişat încrucişează cei doi părinţi şi creează descendenţii acestora;

Pasul_3: Cu o mică probabilitate şi utilizând o funcţie discretă de probabilitate pentru

alegerea porţiunii de mutat efectuează mutaţia unui genotip, eventual un descendent al

încrucişării din pasul anterior;

Pasul_4: Iniţializează o nouă populaţie cu noile fenotipuri (de la paşii 2 şi 3 anteriori);

Pasul_5: Completează utilizând operatorul de selecţie aplicat populaţiei de părinţi noua

populaţie cu fenotipuri (până cel puţin la refacerea numărului iniţial de membrii);

Pasul_6: Refă valorile funcţiei de scor ale noii populaţii în conformitate cu noua

compoziţie a acesteia;

o Până când cel mai bun fenotip al populaţiei satisface o condiţie impusă (condiţie care

reprezintă condiţia de sfârşit a algoritmului).

O problemă dificilă de structură biochimică şi formalismul algoritmilor genetici

Lucrarea (Jäntschi şi alţii, 2007) serveşte drept sursă a exemplificării unei probleme dificile

de structură biochimică şi relaţia acesteia cu o proprietate măsurată. Astfel, în lucrare autorii

pornesc de la datele experimentale ale timpilor de retenţie observaţi pentru separarea

cromatografică a bifenililor policloruraţi (PCBs) raportaţi în (Mullin şi alţii, 1984). Folosind

informaţia structurală, o bază de date conţinând descriptori de structură a fost construită.

cel mai bun fenotip

t+1scor

selecţie

selecţie

t+1

scor

t mutaţie încrucişare t+1

Baza de date pentru studiul problemei dificile de relaţie structură-activitate

`MDF` `ready` `PCB_data` `PCB_xval`

`qspr_qsar` `PCB_yval``PCB_tmpx`

Probe atom `i`

Atomic property

Distance metric

Probe atom `j`

Fragmentation criteria

Interaction descriptor Interaction modelMolecular overall

superposing formula Linearization

formula

Fragment of `i`vs. `j`

Metodologia relaţiilor structură-activitate (SAR) în abordarea Familiei de Descriptori Moleculari

(MDF), imagine preluată din (Jäntschi şi Bolboacă, 2008b)

Problema dificilă de relaţie structură chimică - activitate/proprietate măsurată se formulează

astfel: având la dispoziţie o informaţie structurală (obţinută din realizarea topologiei moleculare a

fiecărui compus pe baza legăturilor chimice care se stabilesc între atomi şi realizarea geometriei

moleculare pe baza aplicării modelelor aproximative ale fizicii cuantice şi moleculare) şi o

informaţie rezultată în urma observaţiei experimentale a unei proprietăţi/activităţi pentru fiecare din

cei 209 compuşi în aceleaşi condiţii de mediu, care este cea mai bună relaţie structură-activitate care

să descrie proprietatea/activitatea compuşilor în funcţie de structură.

În acord cu metodologia descrisă în (Jäntschi şi alţii, 2007) informaţia structurală se poate

valorifica construind o familie de descriptori. Fără a mai detalia procedura clasică de rezolvare a

problemei, abordarea din perspectiva unui algoritm genetic aplicat problemei este următoarea:

÷ Populaţia este familia de descriptori moleculari având fiecare genotip (cromozom) descris de

următoarele gene:

o gena d conţinând operatorul de distanţă folosit la construirea descriptorului molecular

(fenotipului), având 2 valori posibile: `g` - distanţă geometrică; `t` - distanţă topologică;

o gena p conţinând proprietatea atomică folosită la construirea fenotipului, cu 6 valori

posibile: `M` - masa atomică relativă; `Q` - sarcina electrică parţială a atomului (obţinută în

aproximaţia Hückel extinsă); `C` - cardinalitatea (proprietate atomică trivială, totdeauna

valoarea sa pentru orice atom este 1); `E` - electronegativitatea atomică (valoare relativă la

scara de electronegativitate Sanderson); `G` - electronegativitatea de grup (valoare obţinută

prin calcularea unei medii geometrice a electronegativităţii grupului de atomi situat în

imediata vecinătate a atomului cercetat); `H` - numărul de atomi de hidrogen ce înconjoară

atomul cercetat;

o gena I conţinând descriptorul de interacţiune, implicând 2 atomi participanţi şi având una

din următoarele 24 de valori (în care s-au folosit notaţiile: d - operatorul de distanţă; p -

proprietatea atomică): `D(d)`, `d(1/d)`, `O(p1)`, ‘o(1/p1)`, `P(p1p2)`, `p(1/p1p2)`, `Q(√p1p2)`,

`q(1/√p1p2)`, `J(p1d)`, `j(1/p1d)`, `K(p1p2d)`, `k(1/p1p2d)`, `L(d√p1p2)`, `l(1/d√p1p2)`,

`V(p1/d)`, `E(p1/d2)`, `W(p12/d)`, `w(p1p2/d)`, `F(p1

2/d2)`, `f(p1p2/d2)`, `S(p12/d3), `s(p1p2/d3)`,

`T(p12/d4)`, `t(p1p2/d4)`, în care prima literă dă valoarea genei şi între paranteze este dată

formula de calcul asociată valorii acesteia;

o gena O codificând suprapunerea interacţiunilor, fiind implementate 6 valori ale acesteia,

două pentru modele în care interacţiunile sunt rare şi la distanţă (`R` şi `r`), două pentru

modelele în care interacţiunile sunt dense dar la distanţă (`M` şi `m`), şi două pentru

modelele în care interacţiunile sunt dense şi apropiate (`D` şi `d`);

o gena f care codifică algoritmul de fragmentare moleculară pe perechi de atomi, care poate

avea una din următoarele 4 valori: `P` - pentru fragmentare bazată pe căi; `D` - pentru

fragmentare bazată pe distanţe; `M` - pentru fragmentare în fragmente maximale; `m` -

pentru fragmentare în fragmente minimale (fragmente triviale conţinând un singur atom);

o gena M care codifică modalitatea de suprapunere globală a interacţiunilor fragmentelor, care

poate lua una din următoarele 19 valori împărţite în 4 grupuri: grupul de mărimi ( `m` -

selectează cea mai mică valoare; `M` - cea mai mare valoare; `n` - cea mai mică valoare

absolută; `N` - cea mai mare valoare absolută); grupul de medii ( `S` - suma; `A` - media

aritmetică după numărul de proprietăţi de fragmente; `a` - media aritmetică după numărul

de fragmente; `B` - media aritmetică după numărul de atomi; `b` - media aritmetică după

numărul de legături); grupul geometric (`P` - multiplicare; `G` - medie geometrică după

numărul de proprietăţi de fragmente; `g` - medie geometrică după numărul de fragmente;

`F` - medie geometrică după numărul de atomi; `f`` - media geometrică după numărul de

legături); grupul armonic (`s` - suma armonică; `H` - medie armonică după numărul de

proprietăţi de fragmente; `h` - medie armonică după numărul de fragmente; `I` - medie

armonică după numărul de atomi; `i`` - media armonică după numărul de legături);

o gena L care rezultă în algoritm în urma unei mutaţii deterministe asupra fenotipului şi

reprezintă unul din cei 6 operatori de linearizare ce urmează: `I` - identitate, `i` - inversa,

`A` - valoarea absolută, `a` - inversa valorii absolute, `L` - logaritmul valorii absolute, `l` -

logaritmul;

÷ Scorul (funcţia obiectiv): având proprietatea măsurată pentru cei 209 compuşi exprimată în şirul

Y (cu 209 valori), urmează:

o Fenotipul, caracterizat de genele care compun cromozomul este transformat în fenotip când

se calculează valorile corespunzătoare genotipului pentru fiecare din cele 209 molecule ale

setului de PCBs.

o Pentru o funcţie obiectiv de estimare a proprietăţii măsurate folosind 2 genotipuri (în cazul

general putând fi un număr oarecare fixat de genotipuri, r), ecuaţia de regresie este de

forma: Ŷ = a0 + a1·Fenotip1 + a2·Fenotip2, (în general: Ŷ = a0 + Σ1≤i≤rai·Fenotipi), unde:

Ŷ este estimatorul proprietăţii măsurate;

a0..a2 sunt coeficienţii care rezultă din minimizarea pătratelor diferenţelor între valorile

măsurate Y şi cele estimate prin intermediul lui Ŷ pentru setul de 209 compuşi;

Fenotip1=Fenotip(Genotip1) şi Fenotip2=Fenotip(Genotip2) sunt fenotipurile (şirurile de

valori ale descriptorilor moleculari obţinuţi prin operaţiile prescrise de genotipurile

Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2 pentru cei 209 compuşi;

o Tăria (scorul) unei perechi de genotipuri (sau mai multe, pentru regresia multivariată) poate

fi exprimată de una din următoarele (Tabelul 18).

Tabelul 18. Funcţii de scor pentru penalizarea regresiilor cu perechi de fenotipuri

Nr. Scor (i=1..2) Semnificaţie Obiectiv Remarci 1 Σ(Y-a0-Σiai·Fenotipi)p Suma

reziduurilor de estimare

minim Uzual p=2; pentru p = 1 şi mai mult pentru p =1/2 există avantajul că se favorizează tendinţa generală în regresie în defavoarea abaterilor grosolane de la ecuaţia de regresie

2 r2(Y,a0+Σiai·Fenotipi) Coeficient dedeterminare

maxim Are avantajul legăturii cu scopul general al optimizării (maximizarea coeficientului de determinare)

÷ Încrucişarea:

o Se selectează (folosind una din metodele de selecţie descrise în Tabelul 17) două genotipuri,

Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2;

o Se generează două numere aleatoare (din distribuţia uniformă) între 0 şi 6 (fie ele 2 şi 4);

o Se încrucişează Genotip1 cu Genotip2 când se obţin descendenţii Descendent1 =

d1p1I2O2f2M1L1 şi Descendent2 = d2p2I1O1f1M2L2; se obţin fenotipurile acestor descendenţi

şi se adaugă la cultivar;

÷ Mutaţia:

o Se foloseşte o probabilitate de mutaţie α=1/7 (numărul de gene) pentru a decide dacă se

aplică sau nu mutaţia;

o Se alege unul din descendenţi (cel mai tare sau cel mai slab în raport cu scorul, sau

aleatoriu);

o Se generează un număr aleatoriu între 0 şi 6 pentru a decide care genă va suferi mutaţia (fie

acest număr 3);

o Corespunzător lui 3 este gena I; se generează atunci un număr aleatoriu între 1 şi 24

(numărul de valori posibile pe care le permite gena I); folosind valoarea generată aleatoriu

între 1 şi 24 (fie acesta 12) se înlocuieşte valoarea genei I cu noua valoare (pentru 12

valoarea genei I este `k(1/p1p2d)`);

÷ Evoluţia (algoritmul genetic):

o Aşa cum rezultă în acest punct, din întregul populaţiei (care numără, după un calcul simplu)

787968 membrii, implementarea în abordarea algoritmilor genetici necesită generarea şi

păstrarea unui eşantion (cultivar) restrâns din întreaga populaţie (maxim 100 de genotipuri);

fie volumul cultivarului N;

o Se generează aleatoriu N genotipuri;

o Se obţin N fenotipuri asociate celor N genotipuri;

o Se repetă:

Pentru fiecare pereche (în cazul regresiei bivariate) de genotipuri

• Se obţine scorul asociat perechii de fenotipuri: r2(Y,a0+a1·Fenotip1+a2·Fenotip2)

Sfârşit pentru.

Pentru fiecare genotip

• Se obţine scorul genotipului ca valoarea minimă a scorului pe care el îl obţine prin

împerechere cu celelalte genotipuri;

Sfârşit pentru.

Se aleg două genotipuri din cultivar folosind operatorul de selecţie (Tabelul 17) şi se

încrucişează; li se generează fenotipurile şi se adaugă cultivarului (volumul cultivarului

devine N+2);

Se decide dacă unul dintre genotipuri va fi mutat folosind probabilitatea α=1/7; dacă da,

atunci se alege unul dintre genotipurile încrucişate şi se aplică operatorul de mutaţie;

mutantului i se generează fenotipul şi se adaugă cultivarului (în caz favorabil mutaţiei

volumul cultivarului devine N+3);

Folosind scorul genotipurilor se înlătură din cultivar exact atâtea genotipuri până când

volumul cultivarului devine din nou N (minim 0, maxim 3);

o Până când scorul asociat celei mai bune perechi (în cazul regresiei bivariate) de genotipuri

satisface condiţia impusă (de exemplu r2 > 0.99).

÷ Remarcă cu privire la cultivar, mutaţie şi încrucişare:

o Nu orice combinaţie de valori ale genelor produce un fenotip sănătos; la fel mutaţia poate

produce un fenotip mort; acesta este motivul pentru care există posibilitatea ca după rularea

unui ciclu complet de evoluţie, cultivarul să rămână neschimbat (atunci când încrucişarea

urmată de o eventuală mutaţie produc 3 fenotipuri care fie nu se nasc, fie nu se adaptează

mediului);

o Semnificaţia este următoarea: aplicarea secvenţelor de construcţie a fenotipului descrise de

cromozom pentru o anumită moleculă (sau pentru mai multe dintre acestea) poate, în traseul

de construcţie să întâlnească nedeterminări (împărţiri la 0, logaritm din număr negativ);

o Chiar dacă este născut fenotipul, există posibilitatea să nu se adapteze mediului (având de

exemplu valori identice pentru toate moleculele setului, ceea ce-l face nefolositor în

exprimarea unei ecuaţii de regresie cu proprietatea măsurată).

Abordări, variante, adaptări şi alternative ale formalismului algoritmilor genetici

Există multe variante şi adaptări ale algoritmilor genetici menite să îmbunătăţească

performanţele acestora pentru un anume tip de probleme.

Menţionarea tehnicilor derivate şi/sau bazate pe tehnica algoritmilor genetici este suficientă

pentru problematica abordată:

÷ Optimizarea bazată pe strategia coloniilor de furnici (în engleză: Ant colony optimization;

Bouktir şi Slimani, 2005);

÷ Algoritmi bacteriologici (în engleză: Bacteriologic algorithms; Benoit şi alţii, 2005);

÷ Metoda încrucişării entropiei (în engleză: cross-entropy method; De Boer şi alţii, 2005);

÷ Algoritmi culturali (în engleză: Cultural algorithms; Kobti şi alţii, 2004);

÷ Strategii evolutive (în engleză: Evolution strategies; Schwefel, 1995);

÷ Programare evolutivă (în engleză: Evolutionary programming; Fogel şi alţii, 1966);

÷ Optimizare extremistă (în engleză: Extremal optimization; Bak şi Sneppen, 1993);

÷ Adaptare Gausiană (în engleză: Gaussian adaptation; Kjellström, 1991);

÷ Programare genetică (în engleză: genetic programming; Banzhaf şi alţii, 1997);

÷ Algoritmi memetici (în engleză: memetic algorithm; Smith, 2007);

÷ Alte variate, colectate în (Davis, 1991).

Alte abordări conjugă algoritmii genetici cu alte concepte. Următoarele se pot menţiona:

÷ Utilizarea maşinilor cu suport vectorial (în engleză: Support Vector Machines (Brown şi alţii,

2000);

÷ Analiza de localizare a asemănărilor structurale prin histograme secvenţiale (acronim în

engleză: SPLASH; Califano, 2000);

÷ Setul neregulat (în engleză: Rough set; Hvidsten şi alţii, 2001).

Stabilirea necesarelor de materiale şi consumabile, identificarea furnizorilor şi condiţiilor de

procurare, întocmirea documentaţiilor de procurare, derularea licitaţiilor pentru achiziţii

÷ S-au achiziţionat serie de echipamente pentru cercetare:

o Fluorometru (pentru analize în soluţie)

o Staţie Meteo Wireless (pentru monitorizare parametrii de mediu)

o Notebook (pentru preluare date de la fluorometru şi de monitorizare parametrii de

mediu)

÷ S-au achiziţionat o serie de obiecte de inventar necesare cercetării:

o Procesor CPU Intel Xeon Quad Core; Multifunctional Brother; Panou solar fotovoltaic;

Acumulatori; Regulator de încărcare; Afişaj regulator; Invertor; Imprimanta Canon;

Senzor umiditate frunze; Senzor umiditate sol; Senzor temperatura din otel inoxidabil;

Repetitor; Antena Yagi; Repetitor standard wireless

÷ S-au achiziţionat o serie de cărţi:

o Evolutionary Dynamics; Evolutionary Computation: The Fossil Record; The Genetical

Theory of Natural Selection

Planificarea activităţilor experimentale; derularea experimentelor

demonstrative (de testare a metodelor de analiză) ÷ Planificarea activităţilor experimentale urmează schema:

o Selectare activitate biologică de interes (chimie medicală);

o Selectare clasă de compuşi cu potenţă biologică (biochimie);

o Design structură la nivel topologic (chimie matematică);

o Design structură la nivel geometric (chimie cuantică);

o Generare familie de descriptori moleculari (chimie combinatorială);

o Analiză structură-activitate (virtual screening);

o Modelare matematică şi validare statistică (statistică aplicată);

o Selecţie, mutaţie şi încrucişare modele (informatică aplicată);

o Validare potenţă biologică (chimie medicală).

Experimente demonstrative au fost derulate pentru punctul de topire (MP) al aminoacizilor

(fiind incluşi în analiză 31 de aminoacizi, dintre care 23 au format setul de învăţare) când s-a reuşit

îmbunătăţirea capacităţii estimative de la o determinare de 63% (folosind un model structură-

activitate cu o variabilă independentă) 99% (folosind un model structură-activitate cu patru

variabile independente).

Proiectarea şi crearea bazelor de date pentru managementul cercetării şi a

rezultatelor cercetării

÷ Baza de date realizată (denumită MDFV) are următoarea structură (repetitivă pentru fiecare set

de compuşi supus investigaţiilor şi exemplificată pentru setul de 31 de aminoacizi):

o Tabela 31aa_data (3 câmpuri, 31 înregistrări): Id (cheie primară), Mol (abreviere

aminoacid), Hin (câmp binar conţinând designul geometric al structurii obţinut din

optimizarea geometrică a conformaţiei moleculare);

o Tabela 31aa_prop (31 câmpuri, 1 înregistrare): Property (abreviere proprietate), Aib..Val

(câmpuri numerice conţinând valoarea proprietăţii măsurate pentru fiecare compus);

o Tabela 31aa_mdfv (1+31 câmpuri, 2387280 înregistrări): valorile descriptorilor

moleculari indexate după un câmp cheie primară;

o Tabela 31aa__MP (4+31 câmpuri, 7617 înregistrări - pentru MP) - conţinând modelele

structură-activitate cu o variabilă independentă pentru proprietatea MP obţinute în urma

selecţiei pe baza concordanţei folosind algoritmul Goodman-Kruskal;

o Tabela 31aa_qsar (6 câmpuri, număr variabil de înregistrări - 30 pentru MP) - conţinând

modelele structură-activitate mai mult de o variabilă independentă pentru setul 31aa

obţinute în urma încrucişării folosind un algoritm genetic clasic.

÷ Completarea bazelor de date cu cunoştinţele provenite din documentare şi Actualizare

documentare şi respectiv Managementul cunoştinţelor

o Actualizarea documentării cu privire la stadiul cunoaşterii a dus la includerea în evidenţe

a unui număr de 321 de baze de date relevante pentru caracterizarea structurii şi

proprietăţilor chimice ale compuşilor de interes medical, aşa cum s-au enumerat mai sus

în secţiunea "Management cunoştinţe. Identificarea metodelor de analiză. Chimie

Medicală".

o Baza de date a fost completată cu cunoştinţe provenite din Managementul cunoştinţelor

prin includerea în baza de programe a unui algoritm genetic clasic pentru încrucişarea

variabilelor independente aşa cum în lucrarea [Lorentz JÄNTSCHI, Sorana D.

BOLBOACĂ, Mircea V. DIUDEA, Chromatographic Retention Times of Polychlorinated

Biphenyls: from Structural Information to Property Characterization, International Journal of

Molecular Sciences, 8(11), p. 1125-1157, 2007. CAS-AN 2008:423655; CCC&WOS:

000251238700005] a fost prima dată comunicată metoda. Adaptarea acesteia face ca

pentru o funcţie obiectiv de estimare a proprietăţii măsurate folosind 2 genotipuri (în

cazul general putând fi un număr oarecare fixat de genotipuri, r), ecuaţia de regresie este

de forma: Ŷ = a0 + a1·Fenotip1 + a2·Fenotip2, (în general: Ŷ = a0 + Σ1≤i≤rai·Fenotipi),

unde: Ŷ este estimatorul proprietăţii măsurate; a0..a2 sunt coeficienţii care rezultă din

minimizarea pătratelor diferenţelor între valorile măsurate Y şi cele estimate prin

intermediul lui Ŷ pentru setul de compuşi; Fenotip1=Fenotip(Genotip1) şi

Fenotip2=Fenotip(Genotip2) sunt fenotipurile (şirurile de valori ale descriptorilor

moleculari obţinuţi prin operaţiile prescrise de genotipurile Genotip1=d1p1I1O1f1M1L1 şi

Genotip2=d2p2I2O2f2M2L2 pentru compuşi; Tăria (scorul) unei perechi de genotipuri (sau

mai multe, pentru regresia multivariată) se exprimă prin coeficientul de determinare

asociat perechii de fenotipuri: r2(Y,a0+a1·Fenotip1+a2·Fenotip2).

Rezultate publicate

Următoarele publicaţii au fost rezultate din cercetările efectuate în proiect şi menţionează

acest fapt în secţiunea Acknowledgments a lucrării:

÷ lucrare CNCSIS “B+” (BDI: CABI CAB Abstracts şi Thomson Reuters Zoological Record):

Monica ŞTEFU, Sorana D. BOLBOACĂ, Mugur C. BĂLAN, Lorentz JÄNTSCHI, Molecular

Hyperstructures with High Symmetry, Bulletin of University of Agricultural Sciences and

Veterinary Medicine Cluj-Napoca. Horticulture, 65(2), p. 681-686, 2008, AcademicPres, p-

ISSN 1843-5254; e-ISSN 1843-5394.

÷ lucrare indexată în BDI (BDI: CABI CAB Abstracts şi Thomson Reuters Zoological Record):

Lorentz JÄNTSCHI, Sorana D. BOLBOACĂ, Radu E. SESTRAŞ, On about what Can Be Done

and what Cannot Be Done with Genetic Algorithms in Phylogenetic Tree and Gene Sequence

Analyses, Bulletin of University of Agricultural Sciences and Veterinary Medicine Cluj-

Napoca. Horticulture, 65(1), p. 63-70, 2008, AcademicPres, p-ISSN 1843-5254, e-ISSN 1843-

5394.

÷ lucrare ISI (Factor de Impact Jurnal - Thomspon Scientific Reports 2007: 0.859; 2006:

0.767): Lorentz JÄNTSCHI, Violeta POPESCU, Sorana D. BOLBOACĂ, Toxicity Caused by

Para-Substituents of Phenole on Tetrahymena Pyriformis and Structure-Activity Relationships,

Electronic Journal of Biotechnology, 11(3), fulltext 9, DOI: 10.2225/vol11-issue3-fulltext-9,

2008, ISSN 0717-3458.

÷ lucrare ISI (Factor de Impact Jurnal - Thomspon Scientific Reports 2007: 1.103): Lorentz

JÄNTSCHI, Sorana D. BOLBOACĂ, A Structural Modelling Study on Marine Sediments

Toxicity, Marine Drugs, 6(2), p. 372-388, 2008, DOI: 10.3390/md20080017, ISSN 1660-3397.

Cluj-Napoca,

la 28.10.2008