lori.academicdirect.orglori.academicdirect.org/research/grants/ID1051/PCE_ID_1051_Extenso_2008.pdf ·...
Transcript of lori.academicdirect.orglori.academicdirect.org/research/grants/ID1051/PCE_ID_1051_Extenso_2008.pdf ·...
PCE ID-1051
De la Chimia Matematică la Chimia Cuantică şi Chimia Medicală
- lucrare în extenso -
2008
Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese,
workshop-uri) şi dobândirea de competenţe complementare (stagii de
documentare/cercetare în străinătate) Activitatea "Participări la manifestări ştiinţifice (diseminare - conferinţe, congrese,
workshop-uri) şi dobândirea de competenţe complementare (stagii de documentare/cercetare în
străinătate)" este o activitate de tip perfecţionare/documentare prin participarea la stagii scurte în
acest sens în străinătare şi are ca scop dezvoltarea resurselor umane. A fost prevăzută în cadrul celor
3 obiective ale anului 2008, drept activitate 3 (aferentă obiectiv 1), activitate 5 (aferentă obiectiv 2)
şi activitate 9 (aferentă obiectiv 3). Stagiile în străinătate au avut ca subiect participarea la cursuri,
şcoli de vară, simpozioane şi conferinţe internaţionale, acestea fiind detaliate în continuare.
Obiectiv 1. Activitate 3.
÷ Introduction to Practical Statistics for Medical Research
÷ Organizator: University College London (UCL), Londra, UK
÷ Tip: curs
÷ Perioadă: 6-11 Aprilie 2008;
÷ Deplasare: aferentă Obiectiv 1, Activitate 3;
÷ Participanţi: Lorentz JÄNTSCHI;
÷ Tematica cursului:
Basics of Study Design Rumana OMAR UCL Introduction to Data Analysis Caroline DORE MRC Observational Studies in Health Research Rumana OMAR UCL Randomised Controlled Trials Doug ALTMAN UOx Estimation and Hypothesis Testing Gareth AMBLER UCL Comparing Groups of Continuous Data Caroline DORE MRC Analysis of Categotical Data Pauline ROGERS UCL Sample Size Calculations Caroline DORE MRC Correlation and Linear Regression Gareth AMBLER UCL Further Regression Topics Gareth AMBLER UCL Measures of Disease in Health Research Rumana OMAR UCL Logistic Regression Andrew COPAS UCL Analysis of Survival Data Andrew COPAS UCL Analysis of Clustered Data Rebeca TURNER MRC Statistics in Medical Journals Doug ALTMAN UOx Legendă: UCL - University College London, Londra, UK MRC - Medical Research Center, Londra, UK UOx - University of Oxford, Oxford, UK
÷ Puncte cheie din tematica cursului:
o Basics of Study Design
Designul este cel mai important aspect al unui studiu;
Trebuie să răspundă întrebării de cercetare;
Designul studiului acoperă:
• Studii observaţionale;
• Trialuri controlate randomizate;
Este esenţială pregătirea protocolului de cercetare;
Aspecte metodologice:
• Specificarea obiectivului cercetării trebuie să includă:
o Estimarea frecvenţei de apariţie a fenomenului observat;
o Generarea şi testarea ipotezelor;
o Înţelegerea cauzelor fenomenului observat;
o Evaluarea intervenţiei sugerate de cercetare;
• Specificarea populaţiei incluse în studiu:
o Asigurarea reprezentativităţii eşantionului;
o Criteriile de includere şi excludere din studiu;
o Specificarea răspunsului primar urmărit;
o Specificarea răspunsurilor secundare urmărite;
o Asigurarea unui eşantion de control;
o Influenţa dimensiunii eşantionului asupra semnificaţiei;
• Estimarea influenţelor:
o Evaluarea confuziilor între factorul urmărit şi alţi factori;
o Eroarea produsă de selecţie;
o Eroarea produsă de observabilă;
o Eroarea produsă de observator;
o Eroarea produsă de evenimente anterioare celui urmărit;
• Manipularea datelor:
o Responsabilitate;
o Evidenţe duble;
o Construcţie unei baze de date;
o Menţinerea confidenţialităţii;
o Planul de analiză statistică;
o Introduction to Data Analysis
Metode statistice utilizate pentru înţelegerea şi explicarea variaţiilor;
Alegerea metodei de analiză în funcţie de:
• Tipul datelor;
• Structura studiului;
• Presupunerile cu privire la distribuţia datelor;
Tipuri de date grupate pe categorii:
• Două categorii (date binare);
• Categorii nominale (neordonate);
• Categorii ordinale (ordonate);
Variabile răspuns şi variabile expunere;
Date lipsă;
Descrierea datelor;
Măsuri:
• De sumar:
o Valoare tipică;
o Împrăştierea valorilor;
• Valori tipice:
o Media;
o Mediana;
o Centila şi cuartila;
• Împrăştierea valorilor:
o Deviaţia standard;
o Domeniu şi domeniu interquartilic;
Verificarea datelor;
Distribuţii statistice:
• Presupuneri;
• Independenţă;
• Legi de distribuţie:
o Distribuţia normală;
o Distribuţia binomială;
o Distribuţia uniformă;
o Distribuţia log-normală;
o Distribuţia Poisson;
o Distribuţia χ2;
o Distribuţia Student;
Metode parametrice;
Metode neparametrice;
o Observational Studies in Health Research
Studii observaţionale:
• Serii caz-raport;
• Secţionare încrucişată;
• Cohorte;
• Caz-control;
Puterea şi limitele fiecărui tip de studiu;
Tipuri de studii:
• Studii descriptive;
• Studii analitice;
Aplicaţiile designului de studiu;
Stabilirea cauzalităţii în studii observaţionale analitice:
• Criteriul Bradford Hill
o Randomised Controlled Trials
Ce este un trial controlat randomizat;
Aspecte cheie ale designului şi analizei unui trial controlat;
Întâmplarea;
Simularea întâmplării;
Generarea de secvenţe întâmplătoare;
Designul;
Generarea întâmplătoare pe blocuri;
Generarea întâmplătoare stratificată;
Când generarea întâmplătoare apare;
Când generarea întâmplătoare operează corespunzător;
Când generarea întâmplătoare operează necorespunzător;
Alocarea sistematică;
Conducerea (execuţia) unui trial;
Orbirea: asigurarea întâmplării prin privarea de informaţii;
Designul trialurilor clinice;
Trialuri de echivalenţă;
Volumul eşantionului;
Măsuri ale răspunsului;
Protocolul de cercetare;
Probleme de etică;
Probleme cheie ale analizei unui trial controlat;
o Estimation and Hypothesis Testing
Populaţii şi eşantioane;
Analiza statistică;
Estimarea parametrilor populaţiei;
Incertitudinea în estimare;
Distribuţia de eşantionare;
Măsuri ale incertitudinii;
Intervale de încredere;
Testarea ipotezelor în populaţii şi eşantioane;
Valori de probabilitate;
Semnificativ vs. nesemnificativ (statistic);
Interpretarea valorilor de probabilitate;
Estimare vs. testarea ipotezelor;
o Comparing Groups of Continuous Data
Structura datelor;
Presupuneri cu privire la distribuţia datelor;
Eşantioane pereche;
Distribuţia t (Student);
Eşantioane independente;
Distribuţia reziduurilor;
Transformarea logaritmică;
Analiza de varianţă ANOVA;
Distribuţia F (Fisher);
Comparaţii multiple;
Procedura Bonferoni;
o Analysis of Cathegorical Data
Analiza a două grupuri de date grupate pe categorii;
Compararea riscului în două grupuri independente;
Tabele de frecvenţă 2X2;
Testul χ2;
Mai mult de două categorii;
Tabele de frecvenţă mari;
Testul Fisher exact;
Două grupuri pereche;
Testul McNemar;
o Sample size calculations
Importanţa calculului volumului eşantionului;
Calcule bazate pe putere vs. calcule bazate pe precizie;
Metode de bază pentru medii şi pentru proporţii;
Raportarea calculelor de volum de eşantion;
Fezabilitatea studiilor;
Erori de tipul I;
Erori de tipul II;
Nivel de semnificaţie;
o Further Regression Topics
Regresia multiplă;
Predictori binari şi predictori pe categorii;
Interacţiuni;
Selecţia modelelor;
o Measures of Disease in Health Research
Determinarea factorilor ce contribuie la un răspuns medical;
Identificarea şi explicarea amprentelor geografice;
Determinarea, descrierea şi raportarea unui răspuns medical în curs;
Determinarea măsurilor preventive;
Sănătatea în planificarea şi dezvoltarea serviciilor de sănătate;
Furnizarea de date administrative şi de planificare;
o Logistic regression
Când şi unde se foloseşte regresia logistică;
Ce este regresia logistică;
Interpretare: rata parităţilor;
Rata parităţilor vs. riscul relativ;
o Analysis of Survival Data
Ce sunt datele de supravieţuire;
Tabele de viaţă şi curbe de supravieţuire;
Testarea pentru diferite rate de supravieţuire între grupuri;
Analiza de regresie;
Greşeli comune;
o Analysis of clustered data
Când sunt datele grupate;
Metode statistice vs. date grupate;
Metode complexe de investigare;
o Statistics in medical journals
Utilizarea designului şi analizei;
Utilizarea tehnicilor de analiză;
Interpretarea rezultatelor;
Raportarea selectivă a rezultatelor;
Citarea selectivă a literaturii;
Obţinerea concluziilor;
÷ Summer School on Neural Networks in Classification, Regression and Data Mining
÷ Organizator: Institutos Superiores de Engenharia do Porto (ISEP), Porto, PT
÷ Tip: şcoală de vară
÷ Perioadă: 6-12 Iulie 2008;
÷ Deplasare: aferentă Obiectiv 1, Activitate 3;
÷ Participanţi: Lorentz JÄNTSCHI;
÷ Tematica cursului:
Basic Notions. Why NN? Joaquim Marques de Sá MLP and RBF algorithms Petia Georgieva MLP’s with Entropic Criteria Jorge Santos Data Mining with MLPs Paulo Cortez Functional Networks Noelia Sánchez Maroño Multi-class SVMs, Theory Yann Guermeur Functional Networks application Noelia Sánchez Maroño SVMs application to protein secondary structure prediction Yann Guermeur Multiple kernel learning and HM-SVM for bioinformatic applications Alexander Zien Semi-Supervised Learning Alexander Zien Multi-Valued and UB Neurons - I Igor Aizenberg Kernel PLS Mark Embrechts Multi-Valued and UB Neurons - II Igor Aizenberg Selecting Algorithms and Parameters with Meta-Learning Carlos Soares Text Mining Mark Embrechts
÷ Puncte cheie din tematica cursului:
o Basic Notions. Why NN?
Learning Approaches
What are NNs?
A Simple Neuron: The Linear Discriminant
Neural Activation Functions
Learning Dichotomies: The Perceptron
Neural Net Types
FFNN as Universal Approximators
o MLP and RBF algorithms
Historical perspective - biological analogy
Learning algorithms: Backpropagation, conjugate gradient, Newton’s
methods
NN Architectures - MLP, RBF
Examples and applications
o MLP’s with Entropic Criteria
Entropy
Entropy Estimation
Entropy in Learning Systems
Entropic Cost Function
Algorithm Optimizations
Other Similar Algorithms
Experiments
o Data Mining with MLPs
Intensive Care and Meat Quality applications
Knowledge Discovery in Databases (KDD)
Data Mining (DM)
Business Intelligence and Data Mining
DM Methodologies: CRISP-DM
DM goals & DM methods
• Classification
• Regression
• Clustering
• Link analysis
Multilayer Perceptrons (MLPs)
Activation functions
Architecture/Topology
Why Data Mining with MLPs?
• Popularity
• Universal Approximators
• Nonlinearity
• Robustness
• Explanatory Knowledge
Software
R statistical environment
Supervised Learning
Handling Missing Data
Outliers
Non numerical variable remapping
Feature Selection
Classification Metrics
Receiver Operating Characteristic (ROC)
Regression Metrics
Validation method: how to estimate the performance?
MLP Training Algorithm
Local Minima with MLP
Overfitting
Case Study: Intensive Care Medicine (Classification)
Knowledge extraction (Decision Tree example for the renal organ)
Case Study: Lamb Meat Quality (Regression)
o Functional Networks
Introduction to functional networks
Differences between functional and artificial neural networks
Functional equations
Working with functional networks
Different models
Applications
o Multi-class SVMs, Theory
Yann Guermeur
Guaranteed risk for large margin multi-category classifiers
• Theoretical framework
• Basic uniform convergence result
• γ-ψ-dimensions
• Generalized Sauer-Shelah lemma
• Nature and rate of convergence
Multi-class SVM
• Multi-cathegory classification with binary SVMs
• Class of functions implemented by the M-SVMs
• Generalized formulation of the training algorithm
• Three main models of M-SVMs
• Some variants of the main models
• Margins and support vectors
Guaranteed risk for multi-class SVMs
• Bounds on the covering numbers
• Use of the Rademacher complexity
Model selection for multi-class SVMs
• Algorithms fitting the entire regularization path
• Bounds on the leave-one-aut cross-validation error
Open problems
o SVMs application to protein secondary structure prediction
Protein secondary structure prediction
• Different levels of structural organization in proteins
• A problem of central importance in structural biology
• Different measures of prediction accuracy
State of the art
• Choice of the predictors
• Building blocks and architecture of the main prediction methods
Implementation of multi-class SVMs
• Models implemented
• Training algorithm
• Dedicated RBF kernel
• Computation opf weighting vector θ
• Experimental results
Future work
o Multiple kernel learning and HM-SVM for bioinformatic applications
Support Vector Machines (SVMs)
Handling Non-Linearity with Kernels
SVMs as Perceptrons
Application: Predicting Protein Subcellular Localization
Multiple Kernel Learning (MKL)
Large Margin MKL Model
Optimization for MKL
Normalization of Kernels
Multiclass Multiple Kernel Learning
Application: Predicting Protein Subcellular Localization
o Semi-Supervised Learning
Why Semi-Supervised Learning?
Why and How Does SSL Work?
Generative Models
The Semi-Supervised SVM (S3VM)
Graph-Based Methods
Further Approaches (Co-Training, Transduction)
o Multi-Valued and UB Neurons - I
Why we need the complex valued neurons?
A classical Minsky-Papert’s limitation
Is it possible to learn XOR and Parity n functions using a single neuron?
Multi-Valued and Universal Binary Neurons (MVN and UBN)
Multi-valued mappings
Traditional approaches to learn the multiple-valued mappings on a neuron
Sigmoidal neurons: limitations
Multi-Valued Neuron (MVN)
Multi-valued mappings and multiple-valued logic
Discrete-Valued (k-valued) Activation Function
Multiple-Valued (k-valued) Threshold Functions
Learning Algorithm for the Discrete MVN with the Error-Correction
Learning Rule
Continuous-Valued Activation Function
Learning Algorithm for the Continuous MVN with the Error Correction
Learning Rule
A role of the factor 1/(n+1) in the Learning Rule
Self-Adaptation of the Learning Rate
Modified Learning Rules with the Self-Adaptive Learning Rate
Convergence of the learning algorithm
MVN as a model of a biological neuron
P-realizable Boolean Functions over the field of Complex numbers and a
Universal Binary Neuron
Dependence of the number of sectors on the number of inputs
Learning Algorithm for UBN
Mail Applications
o Kernel PLS
Introduction
• Latent Variables
• The Machine Learning Paradox
• Beyond Regression (PCR)
Principal Component Analysis (PCA)
• Definition
• NIPALS algorithm
• Principal Component Regression (PCR)
• Loading factors and variable selection
Partial Least Squares (PLS)
Nonlinear PLS
• Kernels
• Direct kernel methods
• K-PCA
• K-PLS
• Preprocessing and centering the kernel
• Variable/feature selection with sensitivity analysis
Applications
• Portuguese Wine data
• Pima Indians
• Italian Olive Oils multi-class classification
• Svante Wold’s QSAR data
• Real QSAR data
• Time series prediction
o Multi-Valued and UB Neurons - II
Associative memory
A feedforward multilayer MVN-based neural network (MLMVN), its
derivative-free backpropagation learning algorithm and solving some
classification and prediction problems
Learning of the genetic code using MLMVN
Gene expression data classification using MLMVN
Blur identification using MLMVN
Solving the problem of Gene Expression Patterns
Classification using the MVN-based neural network
Learning of non-threshold Boolean functions using a single
UBN
o Selecting Algorithms and Parameters with Meta-Learning
Background: why is this a problem?
• approximating functions with machine learning
• algorithm selection and bias
• a few solutions
Meta-Learning: THE solution
Meta-learning for Algorithm Recommendation
o Text Mining
What is text mining
Text mining process
Visualizations for text mining
Kernel methods
Case studies
Fingerprinting text
Text categorization
Applying text mining to bioinformatics
Customer service center analysis
Detecting ontologies
Obiectiv 2. Activitate 5.
÷ Strasbourg Summer School on Chemoinformatics: CheminfoS3
÷ Organizator: Louis Pasteur University (ULP), Strasbourg, FR
÷ Tip: şcoală de vară
÷ Perioadă: 20-04 Iunie-Iulie 2008;
÷ Deplasare: aferentă Obiectiv 2, Activitate 5;
÷ Participanţi: Lorentz JÄNTSCHI, Carmen E. STOENOIU;
÷ Cursurile şcolii:
QSAR: discovery and first steps T. Fujita History and challenges of chemoinformatics J. Gasteiger Current trends in chemoinformatics W. Warr Fingerprint Design and Molecular Complexity Effects J. Bajorath Diversity Analysis and Library Design V. Gillet De novo Design G. Schneider Lessons learned from modelling bioactivity - what works and what doesn't R. Glen Exploring novel estrogen receptors and more... T. Oprea Tutorial: Impact of dataset composition on models performance A. Varnek Molecular descriptors: an overview R. Todeschini The good, the bad and the ugly practices of QSAR modelling A. Tropsha Pharmacophore Approach in Drug Discovery T. Langer
Classification of chemical reactions J. Aires-de-Sousa
Machine learning methods in QSAR I. Tetko Tutorial on application of non-linear methods in chemistry (neural networks, support vector machines) I. Baskin
In silico target profiling J. Mestres Docking and post-docking strategies D. Rognan What Crystal Structure Databases Tell us about Conformational Preferences of Drug-like Molecules M. Stahl
The Role of Cheminformatics in the Modern Drug Discovery Process P. Ertl ÷ Puncte cheie din cursuri:
o QSAR: discovery and first steps
Origin of Classical QSAR is from the SAR Studies of Agrochemicals
Plant Growth Regulators/Herbicides
Structure-Activity Patterns
The "Birth" of the Multi-variable Approach
Features of the QSAR
Conditions for the QSAR
Classical QSAR for Series of Substituted Analogs
Process of the Emergence of Biological Activity
Early Trials of the Quantitative Approach
Commercialized Drugs developed with the Aid of Classical QSAR
o History and challenges of chemoinformatics
the scope of chemoinformatics
the beginnings
a field of ist own
scientific challenges
political challenges
o Current trends in chemoinformatics
Literature analysis
Hardware and infrastructure
Web 2.0
The Semantic Web
Text mining
Combichem
Evaluation of scientific methods
o Fingerprint Design and Molecular Complexity Effects
Chemical Similarity Searching
Molecular Fingerprints
Similarity Search
Multiple Active Reference Molecules
Molecular Complexity and Size Effects
Fingerprint Design
Activity-Specific Descriptor Value Ranges
Assessment of Descriptor Selectivity
PDR-FP Descriptor Selection
Similarity Assessment with PDR-FP
Relevance of Complexity Effects
Tversky Similarity
Relevance of Complexity Effects
Activity Classes of Different Avg. Size
Pairwise Tversky Similarity
Complexity Effects
Weighted Tversky Coefficient
Random Reduction of Bit Density
o Diversity Analysis and Library Design
Diversity Analysis
• Measuring diversity
• Selecting diverse subsets
• Computational filtering
Combinatorial Library Design
• Designing libraries optimised on multiple properties
• Reduced Graphs as Molecular Descriptors
o De novo Design
De Novo Design Concepts
Adaptive Walk in a “Fitness Landscape”
What is a Molecule?
Local Neighborhood Search
Local Neighborhood Strategies
Elements of Artificial Adaptive Systems
Ant Colony Optimization. A Simple Combinatorial Case: Peptide Design
Ant System for Combinatorial Design
Principle of Evolutionary Strategies
Algorithm of the (1,λ) Evolution Strategy
De novo Fragment Assembly
Operators of Evolutionary Optimization
Particle Swarm Optimization (PSO)
Visualization of Particle Trajectories
COLIBREE®: Combinatorial Library Breeding
Self-Organizing Map (SOM)
Pharmacophore Road Map of Chemical Space
o Lessons learned from modelling bioactivity - what works and what doesn't
Dynamic pharmacophores in the 5HT1b/d GPCR
• An introduction to designing 5-HT1B ligands
• 5-HT1B pharmacophore development
• Homology modelling based on the beta-2 crystal structure
• Dynamic pharmacophores
• Efficacy models
Moving on to Structure-Activity/Property models - some observations
• How reliable are solubility data?
• ‘Solubility’ in the literature
• So, we have created a Solubility Challenge
• Methods to discover models
• Property behaviour
• So - does (Q)SAR work?
• Overfitting and cross validation: three papers to read by Hawkins
• A simple model example, again using solubility - putting in
parameters that relate to the phenomenon
o Exploring novel estrogen receptors and more...
MLI in Numbers
NM MLSC (3-year summary) U54MH074425
Summary Assays NMMLSC
Integrated Discovery Teams
HyperCyt
Integration of VS & HTS
GPR30 - A Novel Estrogen Target for MLI
2D Similarity
Shape Similarity - ROCS
Electrostatic Similarity - EON
In Silico Screening: Bet on all horses…
Summary of Estrogen Receptors Results
Biomolecular Screening Results
Virtual and Biomolecular Screening Workflow
Probe Discovery At NMMLSC
How Many Drug Targets?
WOMBAT-PK
Measured Data in WOMBAT-PK
Drug Targets & Dis-ease
The Fitness Landscape
Multi-Target Binding Affinity Cliffs
Mono-Target Drugs
Current Drugs Classification
Unique Drug Targets by Class
Urban Legend…
Drug Targets Revisited
From DrugBank
What are the relevant drug metabolizing enzymes?
The Problem with unique lists…
More realistic? Overview of drug metabolism
o Tutorial: Impact of dataset composition on models performance
Software
• R
• Weka
Datasets
Model building
• Descriptors
• Data files
• Obtaining and validation of the models
• Extracting the training and the external related test set from the
Cherkasov dataset
• Build and analyze a Bayesian model
• External validations on unrelated test set
Detection of the bias: profiling of data sets
o Molecular descriptors: an overview
The chemical data
Molecular structure
Some historical notes
Molecular descriptors intro
• The role of the molecular descriptors
• Representations of a molecular structure
• Properties of a molecular descriptor
Molecular descriptors detail
• Molecular graph
• Topological matrices
• Local vertex invariants
• Distance matrix
• Strategies for molecular descriptors
o Următoarele 3 figuri
• QSAR strategy
o models ...
regression models (quantitative response)
classification models (qualitative response)
ranking models (ordered response)
• FAQ -Frequently Asked Questions
• FGA - our Frequently Given Answers
o The good, the bad and the ugly practices of QSAR modelling
Introduction: The need for developing externally validated predictive
models of biological data
Why do models fail (bad practices)
Predictive QSAR Modeling Workflow (good practices)
Examples of the Workflow applications
• QSAR based virtual screening and hit identification
• Consensus QSAR modeling of chemical toxicity
Conclusions: “best”QSAR modeling is a decision support science
• focus on accurate predictions
o Pharmacophore Approach in Drug Discovery
Introduction - Non HTS Hit Recognition
The SOSA Approach
• Concept
• Application Examples
Pharmacophore-based Ligand Profiling
• HT Model Generation
• Software Solutions
• Application Examples
o Classification of chemical reactions
Why do we need to classify reactions?
Representation of reactions
RC (Reaction Classification) numbers
Condensed Reaction Graphs (CRG)
Fingerprints of enzymatic reaction features
Representation of the reaction center with physicochemical parameters
• Representation of reactions by physicochemical properties of the
reaction center
Representation of differences between the structures of products and
reactants
• Daylight fingerprints of reactions
Reaction MOLMAPs
Reaction signatures
Fingerprints of reactions based on atom types
o Machine learning methods in QSAR
Multiple Linear Regression (MLR)
Partial Least Squares (PLS)
Support Vector Regression (SVR)
Back-Propagation Neural Network (BPNN)
K Nearest Neighbours(kNN)
Decision Trees (DT)
o Tutorial on application of non-linear methods in chemistry (neural networks,
support vector machines)
Benchmarking of Different Machine Learning Regression Methods
• Machine Learning Methods
• Datasets and Descriptors
• Files
• Step-by-Step Instructions
o Initialization of the Experimenter mode
o Specification of the list of databases to be processed
o Specification of the list of machine learning methods
o Running machine learning methods
o Analysis of obtained results
Descriptor Selection Bias
• Datasets and Descriptors
• Files
• Modeling
o Internal Cross-Validation using Preliminary Selected
Descriptors
o Internal cross-validation using descriptors selected in
course of model building
o External cross-validation
o In silico target profiling
Traditional drug discovery
High-throughput screening
Chemical Screening
The need to go beyond traditional drug discovery
Pharmacological Profiling
Chemogenomic Profiling
Necessary drug discovery
Annotated chemical libraries: WOMBAT
Chemo and Target spaces covered by WOMBAT
Biologically-relevant descriptors: SHED (Shannon Entropy Descriptors)
Biologically-relevant molecular descriptors
Ligand-based approach to in silico pharmacology
Validation example: nuclear receptor family
Target ID case #1: Drug profiling
Target ID case #2: Targeted chemical biology
o Docking and post-docking strategies
A few starting points
Strategic importance of docking
Docking Flowchart
Which Compound Library?
Commercially-available screening collections
Library set--up
Chemical Filters
Pharmacokinetical filters
Lead-likeness
Which Ligand Conformation?
Which Protein coordinates?
Which Docking Tool?
Docking methods
Conformational sampling methods
Which Scoring function?
Scoring functions
Scoring ΔG bind is extraordinarily difficult
Predicting binding free energies
Empirical scoring functions
Potentials of mean force
Force-fields
Predicting ΔG bind is very difficult
Docking Accuracy
Ranking Accuracy
Source of Docking Errors
Pros and Cons of docking codes
Post-processing
Consensus scoring
Efficient Post-processing
Docking + QSAR
Flexible Protein - Flexible ligand docking
Refining docking poses par MM-PB/SA, MM-GB/SA
Use of topological scoring functions
Post-processing by molecular diversity
Post-processing vHTS results
Post-processing: Visual Inspection
Protein-based virtual screening: Current status
o What Crystal Structure Databases Tell us about Conformational Preferences of
Drug-like Molecules
Conformational Energies Matter
• Strained Bioactive Conformations Affect Binding Energy
Required Generalizations
• Statistics over Recurring Fragments
Coverage of Relevant Substructures
• In Crystal Structure Databases
Cis or Trans? From Amides to Electrostatic Repulsion
• Generalized Allylic Strain
• The Sulfonyl Group
• Properties of Aniline Derivatives
• Project Example: New F.VIIaInhibitors
o The Role of Cheminformatics in the Modern Drug Discovery Process
Data Explosion in Chemistry
Cheminformatics in the Pharma Industry
Drug Discovery & Development Process
Typical Cheminformatics Activities at Pharmaceutical Industry
• Molecular databases
• Large-scale data analysis, knowledge discovery
• Calculation of molecular properties / descriptors
• Estimation of ADME characteristics, toxicity alerting
• Navigation in chemistry space
• Virtual screening
• Support for HTS - hitlist triaging
• Support for combinatorial chemistry and molecule optimization
Novartis Web-based Cheminformatics System
• Novartis Data Warehouse - Avalon
• Classification of GPCR Ligands
• Novartis In Silico Profiling
• 3D Hydrophobicity
• Molecular Property Space
• Structural Diversity Space
The Scaffold Tree - Basic Algorithm
• Scaffold Tree Example for HTS results
Virtual Screening
• Virtual Screening Workflow
• Learning from the Nature
High-Throughput Screening - HTS
Combinatorial Chemistry Molecule Design
• Early CombiChem
• Database of Organic Substituents
Bioisosteric Design
• Substituent Bioisosteric Design
Cheminformatics - Future Trends
Obiectiv 3. Activitate 9.
÷ Fourth International Conference of Applied Mathematics and Computing
÷ Organizator: Technical University of Plovdiv (TUP), Plovdiv, BG
÷ Tip: conferinţă internaţională
÷ Perioadă: 11-19 August 2008;
÷ Deplasare: aferentă Obiectiv 3, Activitate 9;
÷ Participanţi: Lorentz JÄNTSCHI, Carmen E. STOENOIU;
÷ Secţiuni ştiinţifice:
o Combinatorics;
o Graph theory;
o ODE, PDE, difference equations;
o Functional equations;
o Integral and differential inequalities and inclusions;
o Differential games;
o Control theory;
o Dynamical systems;
o Probability, statistics and stochastic processes;
o Statistical mechanics;
o Quantum theory;
o Relativity and gravitational theory;
o Integral and differential operators;
o Fractional calculus;
o Special functions;
o Generalized functions;
o Operator research and algebraic analysis;
o Fluid mechanics;
o Mechanics of particles and systems;
o Mathematical programming and optimization;
o Approximation theory;
o Numerical algebraic or transcendental equations;
o Numerical analysis for ordinary differential equations;
o Numerical analysis for partial differential equations;
o Numerical methods in complex analysis;
o Numerical methods in linear algebra;
o Numerical simulation;
o Acceleration of convergence;
o Interval arithmetic;
o Information systems;
o Software engineering;
o Software technology;
o System theory;
o Theory of data;
o Programming and image processing;
o Pattern recognition;
o Parallel and distributed algorithms;
o Communication systems;
o Computer aided design;
o Computer arithmetic and numerical analysis;
o Computer aspects of numerical algorithms;
o Computer networks;
o Concurrent and parallel computations;
o Data base;
o Discrete mathematics in relation to computer science;
o Manufacturing systems;
o Applications in mechanics, physics, chemistry, biology, technology, economics
and industrial problems.
÷ 17th European Symposium on Quantitative Structure-Activity Relationships & Omics
Technologies and Systems Biology
÷ Organizator: The Cheminformatics and QSAR Society (CI-QSAR), Uppsala, SE
÷ Tip: simpozion
÷ Perioadă: 20-27 Septembrie 2008;
÷ Deplasare: aferentă Obiectiv 3, Activitate 9;
÷ Participanţi: Lorentz JÄNTSCHI;
÷ Prezentări:
o Session 1: QSAR in OMICS and Systems Biology
2008:09:22:09.00: Top-Down Systems Biology and Integrative
Approaches to Superorganism Medicine
2008:09:22:10.00: Systems chemical biological studies on enzymatic
metabolic networks and inhibitors
2008:09:22:11.00: Potentialities of PLSand OPLS in 'OMICS' cancer
diagnostics and elucidation of antiumour drugs mechanism of action
2008:09:22:11.20: Building Blocks for Metabolic simulation: Automated
elucidation of metabolite structures
2008:09:22:11.40: Theoretical structural metabolomics
2008:09:22:12.00: QSAR: dead or alive?
o Session 2: QSAR
2008:09:22:14.00: Beyond QSAR
2008:09:22:14.50: Linking chemical and biological similarity of small
molecules
2008:09:22:15.10: A Novel Conservative design for fast followers -
Focused Hierarchical design of a peptide library targeted at M.
tuberculosis Ribonucleotid reductase
2008:09:22:16.00: A QSAR study on indole-based PPAR-y agonists in
respect to receptor binding and gene transactivation data
2008:09:22:16.20: QSAR modelling of small datasets
2008:09:22:16.40: QSAR for Estimation of human volume of distribution
2008:09:22:17.00: Development of Fast, Interpretable 2D pharmacophore
models for predicting hERG and NaV1.5 Cardiac Ion Channel safety
liabilities using TRUST fingerprints
2008:09:22:17.20: Global or local QSAR: is there a way out?
o Session 3: QSAR and Natural Product Medicine
2008:09:23:09.00: PLS-Trees and QSAR
2008:09:23:09.45: Metabolomics in nutritional studies
2008:09:23:12.00: SIRC/TCM: a Database of Traditional Chinese
Medicine
o Session 4: Molecular Modeling and Chemical Properties
2008:09:23:14.00: Does pKa predictions matter anymore?
2008:09:23:14.50: Cytotoxicity and 3D-QSAR Analysis of Lmaellarind
against human hormone dependent breast cancer (T47D) and Humane
hormone independent breast cancer (MDA-MB231)
2008:09:23:15.10: GABAa and GABAc Receptors: Molecular modelling
and QSAR analysis of selective ligands
2008:09:23:15.30: Fast and accurate method for flexible ligand
superposition and shape-based screening
2008:09:23:16.20: Predicted 3D structures for Coupled Receptors G-
Protein and ligand-GPCR complexes for agonists, antagonists, and
inverse agonists
2008:09:23:17.00: Design of New Chemical Entities as selective COX-2
inhibitors using Structure optimisation by QSAR
2008:09:23:17.20: A novel 3D QSAR metod exploiting protein flexibility
to kinase inhibition
2008:09:23:17.40: An automated metod to interface ligand- and structure-
based drug design
o Session 5: Combinatorial Chemistry and Virtual Screening
2008:09:24:09.00: From Molecular Interaction Fields to Enzyme
Inhibitors and Biochemical Networks
2008:09:24:09.45 : Minimizing Benchmark Dataset Bias in Ligand Based
viritual screening by maximum unbiased validation (MUV) Datasets
2008:09:24:10.05: Data mining and comperative analysis of
chemosensitivity and gene expression profiles for human tumor cell lines
o Session 6: QSAR in Toxicology and Environmental Research
2008:09:24:10.50: Human and mammalian toxic equivalency factors for
dioxins and dioxin-like compounds: The who 2005 re-evaluation
2008:09:24:11.35: A combined use of in vitro screening and
cheminformatics approaches improves the accuracy of in vivo toxicity
prediction for environmental chemicals
2008:09:24:12.05: Prediction of cytochrome P450 inhibition by different
approaches of QSAR modeling
o Session 7: Case Studies in QSAR
2008:09:25:09.00: Understanding QSAR: Do we always use the correct
structural models to establish affinity correlation?
2008:09:25:09.50: Computer-aided drug design for the beta2-adrenergic
receptor
2008:09:25:12.00: QSAR investigation of novel compounds targeting the
serotonin receptors
2008:09:25:12.20: Docking and viritual screening for virus targets
exploiting distributed grid technology
o Session 8: QSAR in Chemical Risk Assessment
2008:09:25:14.00: Advances in Toxico-Cheminformatics: Supporting a
New Paradigm for Predictive Toxicology
2008:09:25:14.45: Use of structural alerts to screen EINECS for
substances of very high concern
2008:09:25:15.05: Predicting Toxicity from Non-Test Data: Utilising in
silico and in chemico information for Risk assessment
2008:09:25:16.00: Computational Ecotoxicology to predict
Biomagnification of contaminants
2008:09:25:16.20: Similarity based assessment of Model applicability
domain and quantitative evaluation of reliability of the prediction
2008:09:25:16.40: Using all the data in comprehensive risk assessment of
the mutagenetic potential of drugs
2008:09:25:17.00: Human Monitoring of Phtalates and Chemical Risk
Assessment
o Session 9: Emerging Technologies
2008:09:26:09.00: Complex systems, QSAR, and control of stem cell fate
2008:09:26:09.50: Proteochemometrics
2008:09:26:10.10: From Mathematical chemistry to quantum and
medicinal chemistry through genetic algorithms
2008:09:26:10.50 GAUDI navigator, a new data mining platform
Identificarea metodelor de analiză (Obiectiv: management cunoştinţe)
Chimie Matematică
Studiul sistematic prin instrumente specifice de chimie matematică a fost iniţiat de Crum-
Brown şi Fraser în 1868 prin lucrarea [On the connection between chemical constitution and
physiological action. Part 1. On the physiological action of the salts of the ammonium bases, derived from
Strychnia, Brucia, Thebia, Codeia, Morphia, and Nicotia, Trans R Soc Edinb 25:151-203].
Un pas important în domeniul chimie matematice s-a făcut prin introducerea noţiunii de graf
de către Sylvester în 1874 prin lucrarea [On an Application of the New Atomic Theory to the Graphical
Representation of the Invariants and Covariants of Binary Quantics - With Three Appendices, Am J Math, 1,
64-90] şi odată cu aceasta s-au deschis posibilităţile de explorare a topologiei moleculare. O serie de
monografii au revizuit şi complectat de-a lungul timpului conceptele de teoria grafurilor [(Harary,
1969): Graph Theory, Addison - Wesley, Reading, MA], aplicaţiile grafurilor în chimie [(Kier şi Hall,
1976): Molecular Connectivity in Chemistry and Drug Research, Acad Press, New York, NY], teoria
grafurilor chimice [(Trinajstic, 1983): Chemical Graph Theory, CRC Press, Boca Raton, FL], şi ceea ce
facem referire a fi topologia moleculară [(Diudea şi alţii, 2001 & 2002): Molecular Topology, Nova,
Hutington, NY]. Modelele matematice ale structurii chimice includ:
÷ reprezentarea tridimensională (şi aici se face apel la Chimia Cuantică);
÷ reprezentarea bidimensională (sub formă de formule structurale) numite grafuri moleculare;
÷ reprezentarea sub formă de grafuri neorientate în care vârfurile sunt atomi şi legăturile sunt
muchii;
Teoria grafurilor aplicată în studiul structurilor moleculare reprezintă o ştiinţă
interdisciplinară, numită teoria grafurilor chimice sau topologie moleculară. Prin utilizarea
instrumentelor imprumutate din teoria grafurilor, teoria seturilor şi statistică se încearcă
identificarea facilităţilor structurale implicate în relaţiile structură-activitate. Partiţia proprietăţii
moleculare şi recombinarea valorilor sale fragmentale prin modele aditive este unul dintre
obiectivele principale. Caracterizarea topologică a structurilor chimice permite clasificarea
moleculelor şi modelarea structurilor necunoscute cu proprietăţi dorite.
Noţiuni prealabile
÷ Observaţie - o activitate ce consistă în recepţionarea cunoaşterii prin intermediul simţurilor sau
al instrumentelor:
o Observaţia presupune existenţa unui observator şi a unei observabile;
o Recepţionarea cunoaşterii presupune abstractizarea rezultatului observaţiei;
÷ Măsurare - o activitate ce presupune executarea a două operaţii: observarea şi înregistrarea
rezultatelor observaţiei şi depinde de:
o natura obiectului (material) observat;
o natura fenomenului (imaterial) observat;
o de modalitatea de măsurare şi înregistrare a rezultatelor observaţiei.
÷ Element (`e`): un obiect al unei observaţii sau al unei abstractizări;
÷ Proprietate (`|(e)`): rezultatul unei operaţii de măsurare asupra unui element (`e`);
÷ Mulţime (`S`): o colecţie de elemente (`e`) distincte (ordinea nu este relevantă);
o Remarcă: de obicei o mulţime se constituie din elemente supuse observaţiei unei
proprietăţi;
÷ Mulţimea vidă (`∅`): o mulţime care nu conţine nici un element;
÷ Valoare de adevăr - abstractizare binară (cu 2 valori posibile) a rezultatului unei observaţii:
favorabile (`T` sau `0`) sau nefavorabile (`F` sau `1`);
o Remarcă: valoarea de adevăr este o proprietate (|(e)=0 sau |(e)=1);
÷ Identitatea logică (`≡`): exprimă faptul că rezultatul unei operaţii de măsurare asupra a două
elemente este acelaşi;
÷ Negaţia logică (¬): o operaţie care transformă o valoare de adevăr în contrariul său (¬0→1;
¬1→0; ¬T→F; ¬F→T);
÷ Apartenenţă (la o mulţime): proprietatea unui element de a face parte (∈) sau nu (∉) dintr-o
mulţime;
o Consecinţă:
Apartenenţa unui element la o mulţime are o valoare de adevăr (`∈` ≡ `T` ≡ `0`;
`∉` ≡ `F` ≡ `1`);
÷ Submulţime (`⊆`): S1⊆S ⇔ [∀e∈S1 ⇒ e∈S]
÷ Produs cartezian (`×`): S1×S2 = {(e1,e2) | e1∈S1 şi e2∈S2};
÷ Relaţie binară (`2-r`): R ⊆ S1×S2;
÷ Endorelaţie binară (`2-e-r`): R ⊆ S×S;
÷ Proprietăţi ale endorelaţiilor binare:
o Reflexivitate (`re`): R `re` ⇔ [∀e∈S ⇒ eRe];
o Ireflexivitate (`ir`): R `ir` ⇔ [∀e∈S ⇒ ¬ eRe];
o Coreflexivitate (`cr`): R `cr` ⇔ [∀e1,e2∈S | e1Re2 ⇒ e1≡e2];
o Simetrie (`sy`): R `sy` ⇔ [∀e1,e2∈S | e1Re2 ⇒ e2Re1];
o Antisimetrie (`ns`): R `ns` ⇔ [∀e1,e2∈S | e1Re2 şi e2Re1 ⇒ e1≡e2];
o Asimetrie (`as`): R `as` ⇔ [∀e1,e2∈S | e1Re2 ⇒ ¬ e2Re1];
o Tranzitivitate (`ts`): R `ts` ⇔ [∀e1,e2,e3∈S | e1Re2 şi e2Re3 ⇒ e1Re3];
o Totală (`li`): R `li` ⇔ [∀e1,e2∈S ⇒ e1Re2 sau e2Re1];
o Trihotomă (`tc`): R `tc` ⇔ [∀e1,e2∈S ⇒ !(e1Re2 sau e2Re1 sau e1≡e2)]; ! = exact una din
o Euclidiană (`eu`): R `eu` ⇔ [∀e1,e2,e3∈S | e1Re2 şi e1Re3 ⇒ e2Re3];
o Serială (`se`): R `se` ⇔ [∀e1∈S ∃s2∈S | e1Re2];
o Echivalenţă (`eq`): R `eq` ⇔ R `re` şi R `sy` şi R `ts`;
o Ordine parţială (`po`): R `po` ⇔ R `re` şi R `ns` şi R `ts`;
o Ordine totală (`to`): R `to` ⇔ R `po` şi R `li`;
o Bine ordonată (`wo`): R `wo` ⇔ R `to` şi ¬ R `se`;
o R `sy` şi R `ts` şi R `se` ⇒ R `re`;
÷ Exemple de relaţii binare:
o Relaţia `=`:
reflexivă: ∀e ⇒ e = e;
coreflexivă: ∀e1,e2 | e1 = e2 ⇒ e1 ≡ e2;
simetrică: ∀e1,e2 | e1 = e2 ⇒ e2 = e1;
antisimetrică: ∀e1,e2 | e1 = e2 şi e2 = e1 ⇒ e1 ≡ e2;
tranzitivă: ∀e1,e2,e3 | e1 = e2 şi e2 = e3 ⇒ e1 = e3;
euclidiană: ∀e1,e2,e3 | e1 = e2 şi e1 = e3 ⇒ e2 = e3;
echivalenţă: = `re`, `sy`, `ts`;
o Relaţia `≤`:
reflexivă: ∀e ⇒ e ≤ e;
antisimetrică: ∀e1,e2 | e1 ≤ e2 şi e2 ≤ e1 ⇒ e1 ≡ e2;
tranzitivă: ∀e1,e2,e3 | e1 ≤ e2 şi e2 ≤ e3 ⇒ e1 ≤ e3;
totală: ∀e1,e2 ⇒ e1 ≤ e2 sau e2 ≤ e1;
serială: ∀e1 ∃s2 | e1 ≤ e2;
ordine parţială: ≤ `re`, `ns`, `ts`;
ordine totală: ≤ `re`, `ns`, `ts`, `li`;
o Relaţia `<`:
ireflexivă: ∀e ¬ e < e;
asimetrică: ∀e1,e2 | e1 < e2 ⇒ ¬ e2 < e1;
tranzitivă: ∀e1,e2,e3 | e1 < e2 şi e2 < e3 ⇒ e1 < e3;
trihotomă: ∀e1,e2 ⇒ !(e1 < e2 sau e2 < e1 sau e1 ≡ e2);
serială ⇔ ∀e1 ∃s2 | e1 < e2;
o Relaţia `⊆`:
reflexivă: ∀S ⇒ S ⊆ S;
antisimetrică: ∀S1,S2 | S1 ⊆ S2 şi S2 ⊆ S1 ⇒ S1 ≡ S2;
tranzitivă: ∀S1,S2,S3 | S1 ⊆ S2 şi S2 ⊆ S3 ⇒ S1 ≤ S3;
serială pe mulţimea submulţimilor unei mulţimi ℘(S);
ordine parţială: ⊆ `re`, `ns`, `ts`;
o Relaţia `≠`:
ireflexivă: ∀e ⇒ ¬ e ≠ e;
simetrică: ∀e1,e2 | e1 ≠ e2 ⇒ e2 ≠ e1;
o Relaţia `străbun al` şi `descendent al`:
tranzitivă: A `descendent al` B şi B `descendent al` C ⇒ A `descendent al` C;
o Relaţia distanţă euclidiană finită:
reflexivă: ∀x ⇒ d(x,x)=0 < ∞;
simetrică: ∀x,y ⇒ d(x,y) < ∞ ⇒ d(y,x) < ∞;
tranzitivă: ∀x,y,z | d(x,y) < ∞ şi d(y,z) < ∞ ⇒ d(x,z) < ∞;
euclidiană: ∀x,y,z | d(x,y) < ∞ şi d(x,z) < ∞ ⇒ d(y,z) < ∞;
serială: ∀x ∃y=x | d(x,y)=d(x,x)=0 < ∞;
echivalenţă: d(·,·) < ∞ `re`, `sy`, `ts`;
o Relaţia funcţie definită f:X→Y, y=f(x):
serială: ∀x ∃y | y=f(x);
valoare unică: ∀x,y1,y2 | f(x)=y1 şi f(x)=y2 ⇒ y1≡y2;
injectivă ⇔ ∀x,y | x ≠ y ⇒ f(x) ≠ f(y);
surjectivă ⇔ ∀y ∃x | y=f(x);
bijectivă ⇔ injectivă şi surjectivă;
÷ Funcţie de numărare: o funcţie bijectivă definită pe o mulţime cu valori într-o submulţime a
numerelor naturale;
o Consecinţă: funcţia de numărare induce în codomeniu o relaţie de ordine totală;
÷ Mulţime infinită: o mulţime pe care se poate defini o funcţie de numărare şi orice funcţie de
numărare induce o relaţie de ordine totală;
÷ Mulţime finită: o mulţime pe se poate defini o funcţie de numărare, dar nu există nici o funcţie
de numărare care induce relaţie de ordine totală;
÷ Mulţime de puterea continuului: o mulţime pe care nu se poate defini o funcţie de numărare;
o Consecinţă: orice mulţime de puterea continuului (pe care nu se poate defini o funcţie de
numărare) are acelaşi număr de elemente cu mulţimea funcţiilor {f: ℕ → {0,1}}, adică
2|ℕ|; demonstraţia constă în construcţia unei funcţii bijective între mulţimea funcţiilor
{f:ℕ→{0,1}} şi intervalul de numere reale [0,1) folosind exprimarea numerelor din
intervalul [0,1) în baza de numeraţie 2 (r01=0.f1f2...);
÷ Şir: o mulţime pe care s-a definit o funcţie de numărare;
÷ Şir parţial ordonat: şir în care elementele se află în relaţie de ordine parţială;
÷ Şir total ordonat: şir în care elementele se află în relaţie de ordine totală;
Noţiuni de bază
Un graf G = G(V,E) este o pereche de două mulţimi, V - mulţime finită nevidă ale cărei
elemente se numesc vârfuri (v∈V) şi E - mulţime de perechi de vârfuri (e∈E), care implementează
o (endo-)relaţie binară pe mulţimea V. Două vârfuri vi,vj∈V se numesc adiacente dacă (vi,vj)∈E.
Două perechi de vârfuri (vi1,vj1) şi (vi2,vj2) se numesc adiacente dacă au un vârf comun (i1 = i2 sau i1
= j2 sau j1 = i1 sau j1 = j2).
Următoarele remarci caracterizează grafurile chimice:
÷ În general relaţia definită de E este ireflexivă (pentru orice v∈V, (v,v)∉E);
÷ Dacă relaţia definită de E este simetrică (dacă (v1,v2)∈E atunci (v2,v1)∈E) atunci elementele lui
E se numesc muchii, altfel se numesc arce;
÷ Atunci când se face referinţă la un anume graf G, se notează V = V(G), E = E(G), |V| = N(G), şi
|E| = Q(G); mărimile N(G) şi Q(G) permit transformarea grafului G prin izomorfisme de
numerotare în grafuri (relaţii bijective sau corespondenţe 1 la 1) ale căror vârfuri sunt din
mulţimea {1..N}; într-un astfel de izomorfism, vârfului vi∈V îi poate fi asociat numărul
i∈{1..N} iar muchiei (vi,vj)∈E perechea de numere (i,j)∈{1..N}×{1..N};
÷ Grafului G=(V,E) îi poate fi asociată o pereche de mulţimi de ponderi WG=(WV,WE), în care
fiecărui element v∈V îi corespunde un element wv∈WV (wv numit caracteristica vârfului v) şi
în care fiecărui element e∈E îi corespunde un element we∈WE (we numit caracteristica
muchiei e); ponderile pentru vârfuri sunt asociate proprietăţilor atomice (cum sunt tipul
atomului şi valenţa) în timp ce ponderile pentru muchii sunt asociate proprietăţilor de legătură
(cum sunt tipul legăturii şi lungimea).
În tabelul următor sunt ilustrate câteva utilizări ale diferitelor tipuri de grafuri în teoria
grafurilor chimice.
Tabelul 1. Tipuri de grafuri chimice Graf, G Semnificaţie Tip Reprezentare (V,E) Utilizare
Dacă vârfurile reprezintă sisteme chimice atunci graful reprezintă o reacţie cu preechilibru
orientat neponderat
V={1, 2, 3} E={(1,2), (2,1), (2,3)}
Grafuri de reacţie
k1k2 k3 Dacă vârfurile reprezintă sisteme chimice atunci graful reprezintă o reacţie cu preechilibru
orientat ponderat
V={1, 2, 3} E={(1,2), (2,1), (1,3)} VW={k2, k1, k3}
Grafuri de reacţie
N Cu N Graful reprezintă azanul de cupru
orientat ponderat
V={1, 2, 3} E={(1,2), (3,2)} WV={N, Cu, N}
Chimia complecşilor coordinativi
Dacă vârfurile reprezintă atomi de carbon şi atomii de hidrogen sunt neglijaţi, atunci graful reprezintă propanona
neorientat ponderat
V={1, 2, 3} E={(1,2), (2,1), (2,3), (3,2)} WE={1, 1, 2, 2}
Structuri alcătuite din atomi de acelaşi tip (uzual atomi de carbon)
Dacă vârfurile reprezintă atomi de carbon şi atomii de hidrogen sunt neglijaţi, atunci graful reprezintă izobutanul
neorientat neponderat
V={1, 2, 3, 4} E={(1,4), (4,1), (2,4), (4,2), (3,4), (4,3)}
Structuri alcătuite din atomi şi legături de acelaşi tip
N
Dacă vârfurile nemarcate reprezintă atomi de carbon şi atomii de hidrogen sunt neglijaţi, atunci graful reprezintă vinilamina
neorientat ponderat
V={1, 2, 3} E={(1,2), (2,1), (2,3), (3,2)} WV={N, C, C} WE={1, 1, 2, 2}
Structuri fără legături coordinative
Aşa cum se observă şi din tabelul de mai sus, două categorii de grafuri sunt de interes pentru
topologia moleculară:
÷ Grafurile neorientate şi neponderate, ce conferă maximă generalitate pentru studiul
proprietăţilor graf-teoretice;
÷ Grafurile neorientate şi ponderate, ce conferă maximă specificitate pentru studiul grafurilor
moleculare.
Se uzează de o serie de noţiuni fundamentale de teoria grafurilor, redate în continuare:
÷ Drum: v1...vk∈W(G) dacă (vi,vi+1)∈E pentru 1≤i<k unde prin W(G) s-a notat mulţimea
drumurilor în G;
÷ Drum închis: v1...vk∈W(G) este închis dacă v1=vk;
÷ Dâră: v1...vk∈T(G) dacă (vi,vi+1)∈E pentru 1≤i<k şi (vi+j,vi+j+1)≠(vi,vi+1) pentru 1≤i+j<k, 1<j
unde prin T(G) s-a notat mulţimea dârelor în G;
÷ Dâră închisă: v1...vkv1 dâră închisă dacă v1...vk∈T(G) şi (vk,v1)∈E(G);
÷ Cale: v1...vk∈P(G) dacă (vi,vj)∈E pentru 1≤i<j≤k (v1...vk drum) şi vi≠vj pentru 1≤i<j≤k unde
prin P(G) s-a notat mulţimea căilor în G;
÷ Cale închisă: v1...vkv1 cale închisă dacă v1...vk∈P(G) şi (vk,v1)∈E(G); calea închisă se numeşte
ciclu; mulţimea ciclurilor se notează cu C(G);
÷ Cale terminală: v1...vk∈TP(G) dacă v1...vk∈P(G) şi ∀v∈V(G), v1...vkv∉P(G);
÷ Cale Hamiltoniană: v1...vN(G)∈H(G) dacă v1...vN(G)∈P(G);
÷ Circuit Hamiltonian: v1...vN(G)v1∈HC(G) dacă v1...vN(G)∈H(G) şi (vN(G),v1)∈E(G);
÷ Subgraf (≤): SG=SG(SV,SE)≤G(V,E)=G ⇔ SG graf, SV⊆V şi SE⊆E;
÷ Graf complet: KN=({1..N},{(i,j),(j,i) | 1≤i<j≤N}; într-un graf complet între oricare două vârfuri
există o muchie; tabelul de mai jos redă primele 6 grafuri complete (K1..K6):
Tabelul 2. Primele 6 grafuri complete
· K1 K2 K3 K4 K5 K6
÷ Graf bipartit (bigraf): G=G(V1∪V2,E) bigraf ⇔ [∅=V1∩V2; (vi,vj)∈E ⇒ (vi∈V1, vj∈V2) sau
(vi∈V2, vj∈V1)]; într-un graf bipartit toate muchiile au un vârf din prima partiţie şi celălalt din a
doua partiţie; tabelul de mai jos dă numărul de grafuri bipartite în funcţie de dimensiunea
partiţiilor:
Tabelul 3. Numărul de grafuri bipartite în funcţie de dimensiunea partiţiilor pentru |V|≤10
|V1| vs. |V2| 2 3 4 5 1 1 1 1 12 2 4 6 93 10 34 764 93 5585 1897
÷ Graf bipartit complet: K|V1|,|V2|=G(V1∪V2,E) bigraf complet ⇔ [∅=V1∩V2; (vi,vj)∈E ⇔
(vi∈V1, vj∈V2) sau (vi∈V2, vj∈V1)]; într-un graf bipartit complet toate muchiile au un vârf din
prima partiţie şi celălalt din a doua partiţie şi orice pereche de vârfuri unul dintr-o partiţie şi
celalalt din a doua partiţie este muchie; următorul tabel enumeră toate grafurile bipartite
complete Km,n până la K4,4 (m≤n):
Tabelul 4. Toate grafurile bipartite complete Km,n pentru 1 ≤ m ≤ n ≤ 4
Km,m n=1 n=2 n=3 n=4
m=1 A B B A B
B
AB B
BA
B
BB
m=2
A
BB
A
B
A
B
A
B
A
B BB B
A
m=3
BA B A
BA
A A A
B
B
B
B
m=4
B B
A
B B
AA
A
÷ Graf planar: G=G(V,E) este planar dacă poate fi desenat în plan astfel încât două muchii să se
intersecteze cel mult în capetele (vârfurile) lor; pentru un graf planar se definesc feţele (F); o
faţă (f∈F) a unui graf planar este un ciclu care are cel mult o muchie comună cu celelalte cicluri
ale grafului; între numărul de feţe |F|, de vârfuri |V| şi muchii |E| se stabileşte relaţia Euler [Euler
L. Solutio Problematis ad Geometriam Situs Pertinentis. Comment Acad Sci I Petropolitanae
1736;8:128-140]: |V|-|E|+|F|=2; un graf este planar ⇔ nu există subgrafuri ale lui G homeomorfe
cu K5 sau K3,3 (redate în figura de mai jos), rezultat stabilit de Kuratowski [Kuratowski K. Sur le
Problème des Courbes Gauches en Topologie. Fund Math 1930;15:271-283], dar care oricum nu ajută
prea mult în practică, deoarece problema determinării dacă H homeomorf al lui G este o
problemă dificilă NP-completă (timpul necesar pentru a o rezolva creşte foarte repede cu
dimensiunea grafurilor); tabelul de mai jos redă transformarea unui graf astfel încât muchiile să
nu se intersecteze:
Tabelul 5. Exemplu de trasformare a unui graf la graf planar
1 2
3
4
5
5
1
3
2
4
f1f2
f3
Două transformări aplicate unui graf prezintă importanţă:
÷ Graful linie: L(G)=(LV,LE) graf linie al lui G=(V,E) se obţine astfel:
o i∈LV ⇔ ei∈E;
o (i,j)∈LE ⇔ ei şi ej sunt adiacente.
÷ Graful complementar: G=G(V,E) complementar lui G=G(V,E) ⇔ E=V×V\E.
Tabelul următor prezintă cele două transformări aplicate unui graf:
Tabelul 6. Exemplu de obţinere a grafului linie şi grafului complementar G L(G) G L(G)
Dacă dragul nu este complet, atunci numerotarea induce izomorfie (de numerotare). Două
grafuri G1=G1(V,E) şi G2=G2(V,E) sunt izomorfe dacă există fiz astfel încât:
÷ fiz:V(G1)→V(G2);
÷ ∀v1∈V(G1) ∃! v2∈V(G2) a.î. v1=fiz(v2);
÷ ∀v2∈V(G2), ∃! v1∈V(G1) a.î. v1=fiz(v2);
÷ ∀(vi,vj)∈V(G1) ⇒ (fiz(vi),fiz(vj))∈V(G2);
÷ ∀(vi,vj)∈V(G2) ⇒ (fiz-1(vi),fiz
-1(vj))∈V(G1).
În tabelul următor sunt redate două exemple de grafuri, primul în care numerotarea induce
izomorfia de numerotare şi al doilea în care numerotarea nu induce izomorfie (cazul grafurilor
complete), unde pentru simplitate s-au enumerat muchiile o singură dată:
Tabelul 7. Două exemple de grafuri şi izomorfia de numerotare
Caz Numerotare Reprezentare
4
32 1
4
32 1 V={1, 2, 3, 4}
E={(1,2), (2,3), (3,4), (2,4)}
1 2
43 1
2
43 1 f1(1)=1; f1(2)=3; f1(3)=2/4; f1(4)=4/2;
2 2
34 1
2
34 1 f2(1)=1; f2(2)=4; f2(3)=3/2; f2(4)=2/3;
3 4
31 2
4
31 2 f3(1)=2; f3(2)=1; f3(3)=3/4; f3(4)=4/3;
4 4
13 2
4
13 2 f4(1)=2; f4(2)=3; f4(3)=4/1; f4(4)=1/4;
5 3
14 2
3
14 2 f5(1)=2; f5(2)=4; f5(3)=1/3; f5(4)=3/1;
6 4
21 3
4
21 3 f6(1)=3; f6(2)=1; f6(3)=2/4; f6(4)=4/2;
7 4
12 3
4
12 3 f7(1)=3; f7(2)=2; f7(3)=1/4; f7(4)=4/1;
8 1
24 3
1
24 3 f8(1)=3; f8(2)=4; f8(3)=1/2; f8(4)=2/1;
9 3
21 4
3
21 4 f9(1)=4; f9(2)=1; f9(3)=3/2; f9(4)=2/3;
10 3
12 4
3
12 4 f10(1)=4; f10(2)=2; f10(3)=3/1; f10(4)=1/3;
11 2
13 4
2
13 4 f11(1)=1; f11(2)=3; f11(3)=2/4; f11(4)=4/2;
3
21
32
1
3
21
V={1, 2, 3} E={(1,2), (1,3), (2,3)}
- - - Analiza căilor şi ciclurilor în grafuri este de o importanţă deosebită pentru topologia
moleculară. Astfel se folosesc următoarele noţiuni:
÷ Lungime a unui drum: k | v1...vk∈W(G)
÷ Distanţă: di,j=min{k | v1...vk∈P(G), v1=vi, vk=vj}
÷ Detur: δi,j=max{k | v1...vk∈P(G), v1=vi, vk=vj}
÷ Excentricitate: ecci=max{di,j}
÷ Rază: r(G)=min{ecci}
÷ Diametru: d(G)=max{ecci}
÷ Căi distanţă: v1...vk∈D(G) ⇔ v1...vk∈P(G) şi d1,k=k-1
÷ Căi detur: v1...vk∈Δ(G) ⇔ v1...vk∈P(G) şi δ1,k=k-1
Tabelul următor exemplifică noţiunile de mai sus pe un graf:
Tabelul 8. Drum, distanţă, detur, excentricitate, rază, diametru şi căi în grafuri
1
23 4
6
5
Drumuri în graf
Există o infinitate
Drumuri de lungime dată
De lungime 2: ÷ 121; 131; 212; 232; 313; 323; 343; 434; 454; 464; 545; 565; 656; 646; ÷ 123; 132; 134; 213; 231; 234; 312; 321; 345; 346; 431; 432; 456; 465; 543; 546;
564; 654; 645; 643; Distanţă d1,2=1; d1,3=1; d1,4=2; d1,5=3; d1,6=3;
d2,1=1; d2,3=1; d2,4=2; d2,5=3; d2,6=3; d3,1=1; d3,2=1; d3,4=1; d3,5=2; d3,6=2; d4,1=2; d4,2=2; d4,3=1; d4,5=1; d4,6=1; d5,1=3; d5,2=3; d5,3=2; d5,4=1; d5,6=1; d6,1=3; d6,2=3; d6,3=2; d6,4=1; d6,5=1;
Detur
δ1,2=2; δ1,3=2; δ1,4=3; δ1,5=5; δ1,6=5; δ2,1=2; δ2,3=2; δ2,4=3; δ2,5=5; δ2,6=5; δ3,1=2; δ3,2=2; δ3,4=1; δ3,5=3; δ3,6=3; δ4,1=3; δ4,2=3; δ4,3=1; δ4,5=2; δ4,6=2;
δ5,1=5; δ5,2=5; δ5,3=3; δ5,4=2; δ5,6=2; δ6,1=5; δ6,2=5; δ6,3=3; δ6,4=2; δ6,5=2;
Excentricitate ecc1=3; ecc2=3; ecc3=2; ecc4=2; ecc5=3; ecc6=3; Rază r=2; Diametru d=3; Căi 12; 123; 1234; 12345; 12346; 123456; 123465;
13; 132; 134; 1345; 1346; 13456; 13465; 21; 213; 2134; 21345; 213456; 213465; 23; 231; 234; 2345; 2346; 23456; 23465; 31; 32; 312; 321; 34; 345; 346; 3456; 3465; 45; 46; 456; 465; 43; 431; 4312; 432; 4321; 56; 564; 5643; 56431; 56432; 564312; 564321; 65; 654; 6543; 65431; 65432; 654312; 654321;
Căi terminale 123456; 123465; 132; 13456; 13465; 213456; 213465; 231; 23456; 23465; 312; 321; 3456; 3465; 456; 465; 4321; 4312; 564312; 564321; 54312; 54321; 546; 645; 64312; 64321; 654312; 654321;
Căi distanţă D1,2={12}; D1,3={13}; D1,4={134}; D1,5={1345}; D1,6={1346} D2,1={21}; D2,3={23}; D2,4={234}; D2,5={2345}; D2,6={2346} D3,1={31}; D3,2={32}; D3,4={34}; D3,5={345}; D3,6={346} D4,1={431}; D4,2={432}; D4,3={43}; D4,5={45}; D4,6={46} D5,1={5431}; D5,2={5432}; D5,3={543}; D5,4={54}; D5,6={56} D6,1={6431}; D6,2={6432}; D6,3={643}; D6,4={64}; D6,5={65}
Căi detur Δ1,2={132}; Δ1,3={123}; Δ1,4={1234}; Δ1,5={123465}; Δ1,6={123456} Δ2,1={231}; Δ2,3={213}; Δ2,4={2134}; Δ2,5={213465}; Δ2,6={213456} Δ3,1={321}; Δ3,2={312}; Δ3,4={34}; Δ3,5={3465}; Δ3,6={3456} Δ4,1={4321}; Δ4,2={4312}; Δ4,3={43}; Δ4,5={465}; Δ4,6={456} Δ5,1={564321}; Δ5,2={564312}; Δ5,3={5643}; Δ5,4={564}; Δ5,6={546} Δ6,1={654321}; Δ6,2={654312}; Δ6,3={6543}; Δ6,4={654}; Δ6,5={645}
Matrici şi indici
Se folosesc în studii matricile de Adiacenţă, Laplacian, Distanţă, Detur, Combinatoriale
C(D,2), C(Δ,2), Wiener, Szeged, Căi, Hosoya, Cluj, Distanţă-Extinse, Detur-Extinse, Reciproce,
Drum, Strat, Secvenţă, şi altele mai puţin frecvent.
Molecula reprezentată în următorul tabel (Tabelul 9) este folosită pentru ilustrarea matricilor
ce urmează:
Tabelul 9. Graful molecular supus analizei folosind matrici
5
1 23
46
7 89
1011 ÷ Secvenţa căilor terminale
o Şirul invariant al numărului de căi terminale: 0.0.0.8.12.6.8.8.8.8
o Şirul invariant al lungimii căilor terminale: 0.0.0.32.60.36.56.64.72.80
o Matricea de numărare a căilor terminale:
PTDS 1 2 3 4 5 6 7 8 9 10 Σ Π1 0 0 0 2 0 0 0 2 2 0 6 422 0 0 0 1 0 0 2 0 0 2 5 383 0 0 0 2 0 2 0 0 0 0 4 204 0 0 0 1 0 0 2 0 0 2 5 385 0 0 0 2 0 0 0 2 2 0 6 426 0 0 0 0 4 0 0 0 0 0 4 207 0 0 0 0 2 0 0 4 0 0 6 428 0 0 0 0 2 0 2 0 2 0 6 429 0 0 0 0 1 2 0 0 0 2 5 37
10 0 0 0 0 1 2 0 0 0 2 5 3711 0 0 0 0 2 0 2 0 2 0 6 42
÷ Secvenţa tuturor căilor
o Şirul invariant al numărului de căi: 12.15.19.23.22.18.16.12.8.4
o Şirul invariant al lungimii căilor: 12.30.57.92.110.108.112.96.72.40
o Matricea de numărare a căilor:
PADS 1 2 3 4 5 6 7 8 9 10 Σ Π 1 2 2 3 5 4 4 4 4 2 0 30 1572 2 3 4 4 3 4 4 2 2 2 30 1573 3 4 4 4 2 2 0 0 0 0 19 614 2 3 4 4 3 4 4 2 2 2 30 1575 2 2 3 5 4 4 4 4 2 0 30 1576 3 4 4 4 4 0 0 0 0 0 19 597 2 2 2 4 6 4 4 4 0 0 28 1428 2 2 3 4 5 4 4 2 2 0 28 1429 2 3 4 4 4 3 2 2 2 2 28 142
10 2 3 4 4 4 3 2 2 2 2 28 14211 2 2 3 4 5 4 4 2 2 0 28 142
÷ Secvenţa căilor distanţă
o Şirul invariant al numărului de căi distanţă: 12.15.14.10.8.4.0.0.0.0
o Şirul invariant al lungimii căilor distanţă: 12.30.42.40.40.24.0.0.0.0
o Matricea de numărare a căilor distanţă:
PDDS 1 2 3 4 5 6 7 8 9 10 Σ Π 1 2 2 1 2 2 2 0 0 0 0 11 392 2 3 2 2 2 0 0 0 0 0 11 323 3 4 2 2 0 0 0 0 0 0 11 254 2 3 2 2 2 0 0 0 0 0 11 325 2 2 1 2 2 2 0 0 0 0 11 396 3 4 4 0 0 0 0 0 0 0 11 237 2 2 2 2 4 4 0 0 0 0 16 648 2 2 3 2 2 0 0 0 0 0 11 339 2 3 4 2 0 0 0 0 0 0 11 28
10 2 3 4 2 0 0 0 0 0 0 11 2811 2 2 3 2 2 0 0 0 0 0 11 33
÷ Secvenţa căilor detur
o Şirul invariant al numărului de căi detur: 1.0.11.15.10.2.4.8.8.4
o Şirul invariant al lungimii căilor detur: 1.0.33.60.50.12.28.64.72.40
o Matricea de numărare a căilor detur:
PΔDS 1 2 3 4 5 6 7 8 9 10 Σ Π 1 0 0 2 3 0 0 2 2 2 0 11 66 2 0 0 2 2 1 0 0 2 2 2 11 73 3 1 0 2 4 2 2 0 0 0 0 11 45 4 0 0 2 2 1 0 0 2 2 2 11 73 5 0 0 2 3 0 0 2 2 2 0 11 66 6 1 0 2 4 4 0 0 0 0 0 11 43 7 0 0 2 4 2 0 4 4 0 0 16 92 8 0 0 2 2 3 0 0 2 2 0 11 63 9 0 0 2 2 2 1 0 0 2 2 11 68
10 0 0 2 2 2 1 0 0 2 2 11 68 11 0 0 2 2 3 0 0 2 2 0 11 63
÷ Secvenţa distanţelor
o Şirul invariant al distanţelor: 12.15.11.9.6.2.0.0.0.0
o Şirul invariant al lungimii distanţelor: 12.30.33.36.30.12.0.0.0.0
o Matricea de numărare a distanţelor:
MDDS 1 2 3 4 5 6 7 8 9 10 Σ Π 1 2 2 1 2 2 1 0 0 0 0 10 33 2 2 3 2 2 1 0 0 0 0 0 10 27 3 3 4 2 1 0 0 0 0 0 0 10 21 4 2 3 2 2 1 0 0 0 0 0 10 27 5 2 2 1 2 2 1 0 0 0 0 10 33 6 3 4 3 0 0 0 0 0 0 0 10 20 7 2 2 1 1 2 2 0 0 0 0 10 35 8 2 2 2 2 2 0 0 0 0 0 10 30 9 2 3 3 2 0 0 0 0 0 0 10 25
10 2 3 3 2 0 0 0 0 0 0 10 25 11 2 2 2 2 2 0 0 0 0 0 10 30
÷ Secvenţa detururilor
o Şirul invariant al detururilor: 1.0.8.14.10.2.2.6.8.4
o Şirul invariant al lungimii detururilor: 1.0.24.56.50.12.14.48.72.40
o Matricea de numărare a detururilor:
MΔDS 1 2 3 4 5 6 7 8 9 10 Σ Π 1 0 0 2 3 0 0 1 2 2 0 10 59 2 0 0 2 2 1 0 0 1 2 2 10 65 3 1 0 2 3 2 2 0 0 0 0 10 41 4 0 0 2 2 1 0 0 1 2 2 10 65 5 0 0 2 3 0 0 1 2 2 0 10 59 6 1 0 1 4 4 0 0 0 0 0 10 40 7 0 0 1 3 2 0 2 2 0 0 10 55 8 0 0 1 2 3 0 0 2 2 0 10 60
9 0 0 1 2 2 1 0 0 2 2 10 65 10 0 0 1 2 2 1 0 0 2 2 10 65 11 0 0 1 2 3 0 0 2 2 0 10 60
÷ Adiacenţe:
o Σ(·): 12;
o Σ(·)2: 12;
o ΣA(·): 12;
o ΣA(·)2: 12;
o Matricea:
Ad 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 1 0 0 1 0 0 0 0 0 0 22 1 0 1 0 0 0 0 0 0 0 0 23 0 1 0 1 0 1 0 0 0 0 0 34 0 0 1 0 1 0 0 0 0 0 0 25 1 0 0 1 0 0 0 0 0 0 0 26 0 0 1 0 0 0 0 0 1 1 0 37 0 0 0 0 0 0 0 1 0 0 1 28 0 0 0 0 0 0 1 0 1 0 0 29 0 0 0 0 0 1 0 1 0 0 0 2
10 0 0 0 0 0 1 0 0 0 0 1 211 0 0 0 0 0 0 1 0 0 1 0 2Σ 2 2 3 2 2 3 2 2 2 2 2 24
÷ Distanţe:
o Σ(·): 153;
o Σ(·)2: 537;
o ΣA(·): 12;
o ΣA(·)2: 12;
o Matricea:
Di 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 1 2 2 1 3 6 5 4 4 5 332 1 0 1 2 2 2 5 4 3 3 4 273 2 1 0 1 2 1 4 3 2 2 3 214 2 2 1 0 1 2 5 4 3 3 4 275 1 2 2 1 0 3 6 5 4 4 5 336 3 2 1 2 3 0 3 2 1 1 2 207 6 5 4 5 6 3 0 1 2 2 1 358 5 4 3 4 5 2 1 0 1 3 2 309 4 3 2 3 4 1 2 1 0 2 3 25
10 4 3 2 3 4 1 2 3 2 0 1 2511 5 4 3 4 5 2 1 2 3 1 0 30Σ 33 27 21 27 33 20 35 30 25 25 30 306
÷ Reciproce de Distanţe:
o Σ(·): 26.95;
o Σ(·)2: 17.8302(7);
o ΣA(·): 12;
o ΣA(·)2: 12;
o Matricea:
RDi 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 1.000 0.500 0.500 1.000 0.333 0.167 0.200 0.250 0.250 0.200 4.4002 1.000 0.000 1.000 0.500 0.500 0.500 0.200 0.250 0.333 0.333 0.250 4.8673 0.500 1.000 0.000 1.000 0.500 1.000 0.250 0.333 0.500 0.500 0.333 5.9174 0.500 0.500 1.000 0.000 1.000 0.500 0.200 0.250 0.333 0.333 0.250 4.8675 1.000 0.500 0.500 1.000 0.000 0.333 0.167 0.200 0.250 0.250 0.200 4.4006 0.333 0.500 1.000 0.500 0.333 0.000 0.333 0.500 1.000 1.000 0.500 6.0007 0.167 0.200 0.250 0.200 0.167 0.333 0.000 1.000 0.500 0.500 1.000 4.3178 0.200 0.250 0.333 0.250 0.200 0.500 1.000 0.000 1.000 0.333 0.500 4.5679 0.250 0.333 0.500 0.333 0.250 1.000 0.500 1.000 0.000 0.500 0.333 5.000
10 0.250 0.333 0.500 0.333 0.250 1.000 0.500 0.333 0.500 0.000 1.000 5.00011 0.200 0.250 0.333 0.250 0.200 0.500 1.000 0.500 0.333 1.000 0.000 4.567Σ 4.400 4.867 5.917 4.867 4.400 6.000 4.317 4.567 5.000 5.000 4.567 53.900
÷ Detururi:
o Σ(·): 317;
o Σ(·)2: 2149;
o ΣA(·): 51;
o ΣA(·)2: 231;
o Matricea:
De 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 4 3 3 4 4 7 8 9 9 8 592 4 0 4 3 3 5 8 9 10 10 9 653 3 4 0 4 3 1 4 5 6 6 5 414 3 3 4 0 4 5 8 9 10 10 9 655 4 3 3 4 0 4 7 8 9 9 8 596 4 5 1 5 4 0 3 4 5 5 4 407 7 8 4 8 7 3 0 5 4 4 5 558 8 9 5 9 8 4 5 0 5 3 4 609 9 10 6 10 9 5 4 5 0 4 3 65
10 9 10 6 10 9 5 4 3 4 0 5 6511 8 9 5 9 8 4 5 4 3 5 0 60Σ 59 65 41 65 59 40 55 60 65 65 60 634
÷ Reciproce de Detururi:
o Σ(·): 11.8246031746;
o Σ(·)2: 3.4927762031;
o ΣA(·): 3.45;
o ΣA(·)2: 1.5525;
o Matricea:
RDe 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 0.250 0.333 0.333 0.250 0.250 0.143 0.125 0.111 0.111 0.125 2.0322 0.250 0.000 0.250 0.333 0.333 0.200 0.125 0.111 0.100 0.100 0.111 1.914
3 0.333 0.250 0.000 0.250 0.333 1.000 0.250 0.200 0.167 0.167 0.200 3.1504 0.333 0.333 0.250 0.000 0.250 0.200 0.125 0.111 0.100 0.100 0.111 1.9145 0.250 0.333 0.333 0.250 0.000 0.250 0.143 0.125 0.111 0.111 0.125 2.0326 0.250 0.200 1.000 0.200 0.250 0.000 0.333 0.250 0.200 0.200 0.250 3.1337 0.143 0.125 0.250 0.125 0.143 0.333 0.000 0.200 0.250 0.250 0.200 2.0198 0.125 0.111 0.200 0.111 0.125 0.250 0.200 0.000 0.200 0.333 0.250 1.9069 0.111 0.100 0.167 0.100 0.111 0.200 0.250 0.200 0.000 0.250 0.333 1.822
10 0.111 0.100 0.167 0.100 0.111 0.200 0.250 0.333 0.250 0.000 0.200 1.82211 0.125 0.111 0.200 0.111 0.125 0.250 0.200 0.250 0.333 0.200 0.000 1.906Σ 2.032 1.914 3.150 1.914 2.032 3.133 2.019 1.906 1.822 1.822 1.906 23.649
÷ Matricea Cluj pe Distanţe, CJD:
o Definiţie: CJDi,j = max|CJDSi,j|; {k}∈CJDSi,j ⇔ d(G)k,i<d(G)k,j şi ∃p∈D(G)i,j,
∃q∈D(G)k,i: p∩q={i};
o Referinţe:
÷ Diudea MV. 1997. Cluj Matrix, CJu: Source of Various Graph Descriptors.
Commun Math Comput Chem 35:169-183.
÷ Jäntschi L. 2002. Graph Theory. 1. Fragmentation of Structural Graphs.
Leonardo El J Pract Technol 1(1):19-36.
o Enumerarea seturilor CJDS:
(i,j) p∈D(G)i,j CJDSi,j (1, 2) [1, 2] {1, 5} (2, 1) [2,1] {2, 3, 6, 7, 8, 9, 10, 11} (1, 3) [1, 2, 3] {1, 5} (3, 1) [3, 2, 1] {3, 4, 6, 7, 8, 9, 10, 11} (1, 4) [1, 5, 4] {1, 2} (4, 1) [4, 5, 1] {3, 4, 6, 7, 8, 9, 10, 11} (1, 5) [1, 5] {1, 2} (5, 1) [5, 1] {4, 5} (1, 6) [1, 2, 3, 6] {1, 5} (6, 1) [6, 3, 2, 1] {6, 7, 8, 9, 10, 11} (1, 7) [1, 2, 3, 6, 9, 8, 7] {1, 4, 5} (1, 7) [1, 2, 3, 6, 10, 11, 7] {1, 4, 5} (7, 1) [7, 8, 9, 6, 3, 2, 1] {7, 10, 11} (7, 1) [7, 11, 10, 6, 3, 2, 1] {7, 8, 9} (1, 8) [1, 2, 3, 6, 9, 8] {1, 4, 5} (8, 1) [8, 9, 6, 3, 2, 1] {7, 8, 10, 11} (1, 9) [1, 2, 3, 6, 9] {1, 4, 5} (9, 1) [9, 6, 3, 2, 1] {7, 8, 9, 10, 11} (1, 10) [1, 2, 3, 6, 10] {1, 4, 5} (10, 1) [10, 6, 3, 2, 1] {7, 8, 9, 10, 11} (1, 11) [1, 2, 3, 6, 10, 11] {1, 4, 5} (11, 1) [11, 10, 6, 3, 2, 1] {7, 8, 9, 11} (2, 3) [2, 3] {1, 2} (3, 2) [3, 2] {3, 4, 6, 7, 8, 9, 10, 11} (2, 4) [2, 3, 4] {1, 2} (4, 2) [4, 3, 2] {4, 5}
(2, 5) [2, 1, 5] {2, 3, 6, 7, 8, 9, 10, 11} (5, 2) [5, 1, 2] {4, 5} (2, 6) [2, 3, 6] {1, 2, 5} (6, 2) [6, 3, 2] {6, 7, 8, 9, 10, 11} (2, 7) [2, 3, 6, 9, 8, 7] {1, 2, 4, 5} (2, 7) [2, 3, 6, 10, 11, 7] {1, 2, 4, 5} (7, 2) [7, 8, 9, 6, 3, 2] {7, 10, 11} (7, 2) [7, 11, 10, 6, 3, 2] {7, 8, 9} (2, 8) [2, 3, 6, 9, 8] {1, 2, 4, 5} (8, 2) [8, 9, 6, 3, 2] {7, 8, 11} (2, 9) [2, 3, 6, 9] {1, 2, 4, 5} (9, 2) [9, 6, 3, 2] {7, 8, 9, 10, 11} (2, 10) [2, 3, 6, 10] {1, 2, 4, 5} (10, 2) [10, 6, 3, 2] {7, 8, 9, 10, 11} (2, 11) [2, 3, 6, 10, 11] {1, 2, 4, 5} (11, 2) [11, 10, 6, 3, 2] {7, 8, 11} (3, 4) [3, 4] {2, 3, 6, 7, 8, 9, 10, 11} (4, 3) [4, 3] {4, 5} (3, 5) [3, 4, 5] {2, 3, 6, 7, 8, 9, 10, 11} (5, 3) [5, 4, 3] {1, 5} (3, 6) [3, 6] {1, 2, 3, 4, 5} (6, 3) [6, 3] {6, 7, 8, 9, 10, 11} (3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5} (3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5} (7, 3) [7, 8, 9, 6, 3] {7, 11} (7, 3) [7, 11, 10, 6, 3] {7, 8} (3, 8) [3, 6, 9, 8] {1, 2, 3, 4, 5} (8, 3) [8, 9, 6, 3] {7, 8, 11} (3, 9) [3, 6, 9] {1, 2, 3, 4, 5} (9, 3) [9, 6, 3] {7, 8, 9} (3, 10) [3, 6, 10] {1, 2, 3, 4, 5} (10, 3) [10, 6, 3] {7, 10, 11} (3, 11) [3, 6, 10, 11] {1, 2, 3, 4, 5} (11, 3) [11, 10, 6, 3] {7, 8, 11} (4, 5) [4, 5] {3, 4, 6, 7, 8, 9, 10, 11} (5, 4) [5, 4] {1, 5} (4, 6) [4, 3, 6] {1, 4, 5} (6, 4) [6, 3, 4] {6, 7, 8, 9, 10, 11} (4, 7) [4, 3, 6, 9, 8, 7] {1, 2, 4, 5} (4, 7) [4, 3, 6, 10, 11, 7] {1, 2, 4, 5} (7, 4) [7, 8, 9, 6, 3, 4] {7, 10, 11} (7, 4) [7, 11, 10, 6, 3, 4] {7, 8, 9} (4, 8) [4, 3, 6, 9, 8] {1, 2, 4, 5} (8, 4) [8, 9, 6, 3, 4] {7, 8, 11} (4, 9) [4, 3, 6, 9] {1, 2, 4, 5} (9, 4) [9, 6, 3, 4] {7, 8, 9, 10, 11} (4, 10) [4, 3, 6, 10] {1, 2, 4, 5} (10, 4) [10, 6, 3, 4] {7, 8, 9, 10, 11} (4, 11) [4, 3, 6, 10, 11] {1, 2, 4, 5} (11, 4) [11, 10, 6, 3, 4] {7, 8, 11}
(5, 6) [5, 4, 3, 6] {1, 5} (6, 5) [6, 3, 4, 5] {6, 7, 8, 9, 10, 11} (5, 7) [5, 4, 3, 6, 9, 8, 7] {1, 2, 5} (5, 7) [5, 4, 3, 6, 10, 11, 7] {1, 2, 5} (7, 5) [7, 8, 9, 6, 3, 4, 5] {7, 10, 11} (7, 5) [7, 11, 10, 6, 3, 4, 5] {7, 8, 9} (5, 8) [5, 4, 3, 6, 9, 8] {1, 2, 5} (8, 5) [8, 9, 6, 3, 4, 5] {7, 8, 10, 11} (5, 9) [5, 4, 3, 6, 9] {1, 2, 5} (9, 5) [9, 6, 3, 4, 5] {7, 8, 9, 10, 11} (5, 10) [5, 4, 3, 6, 10] {1, 2, 5} (10, 5) [10, 6, 3, 4, 5] {7, 8, 9, 10, 11} (5, 11) [5, 4, 3, 6, 10, 11] {1, 2, 5} (11, 5) [11, 10, 6, 3, 4, 5] {7, 8, 9, 11} (6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9} (6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10} (7, 6) [7, 8, 9, 6] {7, 11} (7, 6) [7, 11, 10, 6] {7, 8} (6, 8) [6, 9, 8] {1, 2, 3, 4, 5, 6, 10} (8, 6) [8, 9, 6] {7, 8} (6, 9) [6, 9] {1, 2, 3, 4, 5, 6, 10, 11} (9, 6) [9, 6] {7, 8, 9} (6, 10) [6, 10] {1, 2, 3, 4, 5, 6, 8, 9} (10, 6) [10, 6] {7, 10, 11} (6, 11) [6, 10, 11] {1, 2, 3, 4, 5, 6, 9} (11, 6) [11, 10, 6] {7, 11} (7, 8) [7, 8] {7, 10, 11} (8, 7) [8, 7] {1, 2, 3, 4, 5, 6, 8, 9} (7, 9) [7, 8, 9] {7, 11} (9, 7) [9, 8, 7] {1, 2, 3, 4, 5, 6, 9} (7, 10) [7, 11, 10] {7, 8} (10, 7) [10, 11, 7] {1, 2, 3, 4, 5, 6, 10} (7, 11) [7, 11] {7, 8, 9} (11, 7) [11, 7] {1, 2, 3, 4, 5, 6, 10, 11} (8, 9) [8, 9] {7, 8, 11} (9, 8) [9, 8] {1, 2, 3, 4, 5, 6, 9, 10} (8, 10) [8, 9, 6, 10] {7, 8} (8, 10) [8, 7, 11, 10] {8, 9} (10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10} (8, 11) [8, 7, 11] {8, 9} (11, 8) [11, 7, 8] {10, 11} (9, 10) [9, 6, 10] {8, 9} (10, 9) [10, 6, 9] {10, 11} (9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9} (11, 9) [11, 10, 6, 9] {7, 11} (11, 9) [11, 7, 8, 9] {10, 11} (10, 11) [10, 11] {1, 2, 3, 4, 5, 6, 9, 10} (11, 10) [11, 10] {7, 8, 11}
o Σ(CJD): 229.5;
o Σ(CJD)2: 824;
o ΣA(CJD): 60.5;
o ΣA(CJD)2: 242;
o Matricea CJD:
CJD 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 2 2 2 2 2 3 3 3 3 3 252 8 0 2 2 8 3 4 4 4 4 4 433 8 8 0 8 8 5 5 5 5 5 5 624 8 2 2 0 8 3 4 4 4 4 4 435 2 2 2 2 0 2 3 3 3 3 3 256 6 6 6 6 6 0 7 7 8 8 7 677 3 3 2 3 3 2 0 3 2 2 3 268 4 3 3 3 4 2 8 0 3 2 2 349 5 5 3 5 5 3 7 8 0 2 7 50
10 5 5 3 5 5 3 7 7 2 0 8 5011 4 3 3 3 4 2 8 2 2 3 0 34Σ 53 39 28 39 53 27 56 46 36 36 46 459
o Σ(RCJD): 16.441(6);
o Σ(RCJD)2: 4.45;
o ΣA(RCJD): 3.308(3);
o ΣA(RCJD)2: 0.78(3);
o Matricea RCJD:
RCJD 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 0.500 0.500 0.500 0.500 0.500 0.333 0.333 0.333 0.333 0.333 4.1672 0.125 0.000 0.500 0.500 0.125 0.333 0.250 0.250 0.250 0.250 0.250 2.8333 0.125 0.125 0.000 0.125 0.125 0.200 0.200 0.200 0.200 0.200 0.200 1.7004 0.125 0.500 0.500 0.000 0.125 0.333 0.250 0.250 0.250 0.250 0.250 2.8335 0.500 0.500 0.500 0.500 0.000 0.500 0.333 0.333 0.333 0.333 0.333 4.1676 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.143 0.125 0.125 0.143 1.5127 0.333 0.333 0.500 0.333 0.333 0.500 0.000 0.333 0.500 0.500 0.333 4.0008 0.250 0.333 0.333 0.333 0.250 0.500 0.125 0.000 0.333 0.500 0.500 3.4589 0.200 0.200 0.333 0.200 0.200 0.333 0.143 0.125 0.000 0.500 0.143 2.377
10 0.200 0.200 0.333 0.200 0.200 0.333 0.143 0.143 0.500 0.000 0.125 2.37711 0.250 0.333 0.333 0.333 0.250 0.500 0.125 0.500 0.500 0.333 0.000 3.458Σ 2.275 3.192 4.000 3.192 2.275 4.033 2.045 2.611 3.325 3.325 2.611 32.883
÷ Matricea Cluj pe Detururi, CJΔ:
o Definiţie: CJΔi,j = max|CJΔSi,j|; {k}∈CJΔSi,j ⇔ d(G)k,i<d(G)k,j şi ∃p∈Δ(G)i,j,
∃q∈D(G)k,i: p∩q={i};
o Referinţe:
÷ Diudea MV, Pârv B, Gutman I. 1997. Detour-Cluj Matrix and Derived
Invariants. J Chem Inf Comput Sci 37(6):1101-1108.
÷ Jäntschi L. 2002. Graph Theory. 1. Fragmentation of Structural Graphs.
Leonardo El J Pract Technol 1(1):19-36.
o Enumerarea seturilor CJΔS:
(i,j) p∈Δ(G)i,j CJΔSi,j (1, 2) [1, 5, 4, 3, 2] {1} (2, 1) [2, 3, 4, 5, 1] {2} (1, 3) [1, 5, 4, 3] {1} (3, 1) [3, 4, 5, 1] {3, 6, 7, 8, 9, 10, 11} (1, 4) [1, 2, 3, 4] {1} (4, 1) [4, 3, 2, 1] {4} (1, 5) [1, 2, 3, 4, 5] {1} (5, 1) [5, 4, 3, 2, 1] {5} (1, 6) [1, 5, 4, 3, 6] {1, 2} (6, 1) [6, 3, 4, 5, 1] {6, 7, 8, 9, 10, 11} (1, 7) [1, 5, 4, 3, 6, 10, 11, 7] {1, 2} (1, 7) [1, 5, 4, 3, 6, 9, 8, 7] {1, 2} (7, 1) [7, 8, 9, 6, 3, 4, 5, 1] {7, 10, 11} (7, 1) [7, 11, 10, 6, 3, 4, 5, 1] {7, 8, 9} (1, 8) [1, 5, 4, 3, 6, 10, 11, 7, 8] {1, 2} (8, 1) [8, 7, 11, 10, 6, 3, 4, 5, 1] {8, 9} (1, 9) [1, 5, 4, 3, 6, 10, 11, 7, 8, 9] {1, 2} (9, 1) [9, 8, 7, 11, 10, 6, 3, 4, 5, 1] {9} (1, 10) [1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {1, 2} (10, 1) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1] {10} (1, 11) [1, 5, 4, 3, 6, 9, 8, 7, 11] {1, 2} (11, 1) [11, 7, 8, 9, 6, 3, 4, 5, 1] {10, 11} (2, 3) [2, 1, 5, 4, 3] {2} (3, 2) [3, 4, 5, 1, 2] {3, 6, 7, 8, 9, 10, 11} (2, 4) [2, 1, 5, 4] {2} (4, 2) [4, 5, 1, 2] {4} (2, 5) [2, 3, 4, 5] {2} (5, 2) [5, 4, 3, 2] {5} (2, 6) [2, 1, 5, 4, 3, 6] {2} (6, 2) [6, 3, 4, 5, 1, 2] {6, 7, 8, 9, 10, 11} (2, 7) [2, 1, 5, 4, 3, 6, 10, 11, 7] {2} (2, 7) [2, 1, 5, 4, 3, 6, 9, 8, 7] {2} (7, 2) [7, 8, 9, 6, 3, 4, 5, 1, 2] {7, 10, 11} (7, 2) [7, 11, 10, 6, 3, 4, 5, 1, 2] {7, 8, 9} (2, 8) [2, 1, 5, 4, 3, 6, 10, 11, 7, 8] {2} (8, 2) [8, 7, 11, 10, 6, 3, 4, 5, 1, 2] {8, 9} (2, 9) [2, 1, 5, 4, 3, 6, 10, 11, 7, 8, 9] {2} (9, 2) [9, 8, 7, 11, 10, 6, 3, 4, 5, 1, 2] {9} (2, 10) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {2} (10, 2) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10} (2, 11) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11] {2} (11, 2) [11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10, 11} (3, 4) [3, 2, 1, 5, 4] {3, 6, 7, 8, 9, 10, 11} (4, 3) [4, 5, 1, 2, 3] {4} (3, 5) [3, 2, 1, 5] {3, 6, 7, 8, 9, 10, 11} (5, 3) [5, 1, 2, 3] {5} (3, 6) [3, 6] {1, 2, 3, 4, 5} (6, 3) [6, 3] {6, 7, 8, 9, 10, 11} (3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5}
(3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5} (7, 3) [7, 8, 9, 6, 3] {7, 11} (7, 3) [7, 11, 10, 6, 3] {7, 8} (3, 8) [3, 6, 10, 11, 7, 8] {1, 2, 3, 4, 5} (8, 3) [8, 7, 11, 10, 6, 3] {8, 9} (3, 9) [3, 6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5} (9, 3) [9, 8, 7, 11, 10, 6, 3] {9} (3, 10) [3, 6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5} (10, 3) [10, 11, 7, 8, 9, 6, 3] {10} (3, 11) [3, 6, 9, 8, 7, 11] {1, 2, 3, 4, 5} (11, 3) [11, 7, 8, 9, 6, 3] {10, 11} (4, 5) [4, 3, 2, 1, 5] {4} (5, 4) [5, 1, 2, 3, 4] {5} (4, 6) [4, 5, 1, 2, 3, 6] {4} (6, 4) [6, 3, 2, 1, 5, 4] {6, 7, 8, 9, 10, 11} (4, 7) [4, 5, 1, 2, 3, 6, 10, 11, 7] {4} (4, 7) [4, 5, 1, 2, 3, 6, 9, 8, 7] {4} (7, 4) [7, 8, 9, 6, 3, 2, 1, 5, 4] {7, 10, 11} (7, 4) [7, 11, 10, 6, 3, 2, 1, 5, 4] {7, 8, 9} (4, 8) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8] {4} (8, 4) [8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {8, 9} (4, 9) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4} (9, 4) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {9} (4, 10) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4} (10, 4) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10} (4, 11) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11] {4} (11, 4) [11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10, 11} (5, 6) [5, 1, 2, 3, 6] {4, 5} (6, 5) [6, 3, 2, 1, 5] {6, 7, 8, 9, 10, 11} (5, 7) [5, 1, 2, 3, 6, 10, 11, 7] {4, 5} (5, 7) [5, 1, 2, 3, 6, 9, 8, 7] {4, 5} (7, 5) [7, 8, 9, 6, 3, 2, 1, 5] {7, 10, 11} (7, 5) [7, 11, 10, 6, 3, 2, 1, 5] {7, 8, 9} (5, 8) [5, 1, 2, 3, 6, 10, 11, 7, 8] {4, 5} (8, 5) [8, 7, 11, 10, 6, 3, 2, 1, 5] {8, 9} (5, 9) [5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4, 5} (9, 5) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5] {9} (5, 10) [5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4, 5} (10, 5) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5] {10} (5, 11) [5, 1, 2, 3, 6, 9, 8, 7, 11] {4, 5} (11, 5) [11, 7, 8, 9, 6, 3, 2, 1, 5] {10, 11} (6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9} (6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10} (7, 6) [7, 8, 9, 6] {7, 11} (7, 6) [7, 11, 10, 6] {7, 8} (6, 8) [6, 10, 11, 7, 8] {1, 2, 3, 4, 5, 6} (8, 6) [8, 7, 11, 10, 6] {8} (6, 9) [6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5, 6} (9, 6) [9, 8, 7, 11, 10, 6] {9} (6, 10) [6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5, 6}
(10, 6) [10, 11, 7, 8, 9, 6] {10} (6, 11) [6, 9, 8, 7, 11] {1, 2, 3, 4, 5, 6} (11, 6) [11, 7, 8, 9, 6] {11} (7, 8) [7, 11, 10, 6, 9, 8] {7} (8, 7) [8, 9, 6, 10, 11, 7] {8} (7, 9) [7, 11, 10, 6, 9] {7} (9, 7) [9, 6, 10, 11, 7] {9} (7, 10) [7, 8, 9, 6, 10] {7} (10, 7) [10, 6, 9, 8, 7] {10} (7, 11) [7, 8, 9, 6, 10, 11] {7} (11, 7) [11, 10, 6, 9, 8, 7] {11} (8, 9) [8, 7, 11, 10, 6, 9] {8} (9, 8) [9, 6, 10, 11, 7, 8] {9} (8, 10) [8, 9, 6, 10] {7, 8} (8, 10) [8, 7, 11, 10] {8, 9} (10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10} (8, 11) [8, 9, 6, 10, 11] {8} (11, 8) [11, 10, 6, 9, 8] {11} (9, 10) [9, 8, 7, 11, 10] {9} (10, 9) [10, 11, 7, 8, 9] {10} (9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9} (11, 9) [11, 10, 6, 9] {7, 11} (11, 9) [11, 7, 8, 9] {10, 11} (10, 11) [10, 6, 9, 8, 7, 11] {10} (11, 10) [11, 7, 8, 9, 6, 10] {11}
o Σ(CJΔ): 127.5;
o Σ(CJΔ)2: 268;
o ΣA(CJΔ): 27.5;
o ΣA(CJΔ)2: 63;
o Matricea CJΔ:
CJΔ 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 1 1 1 1 2 2 2 2 2 2 162 1 0 1 1 1 1 1 1 1 1 1 103 7 7 0 7 7 5 5 5 5 5 5 584 1 1 1 0 1 1 1 1 1 1 1 105 1 1 1 1 0 2 2 2 2 2 2 166 6 6 6 6 6 0 7 6 6 6 6 617 3 3 2 3 3 2 0 1 1 1 1 208 2 2 2 2 2 1 1 0 1 2 1 169 1 1 1 1 1 1 1 1 0 1 7 16
10 1 1 1 1 1 1 1 7 1 0 1 1611 2 2 2 2 2 1 1 1 2 1 0 16Σ 25 25 18 25 25 17 22 27 22 22 27 255
o Σ(RCJΔ): 38.01(6);
o Σ(RCJΔ)2: 26.6857;
o ΣA(RCJΔ): 9.492857;
o ΣA(RCJΔ)2: 7.6523809;
o Matricea RCJΔ:
RCJΔ 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 1.000 1.000 1.000 1.000 0.500 0.500 0.500 0.500 0.500 0.500 7.0002 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.0003 0.143 0.143 0.000 0.143 0.143 0.200 0.200 0.200 0.200 0.200 0.200 1.7714 1.000 1.000 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.0005 1.000 1.000 1.000 1.000 0.000 0.500 0.500 0.500 0.500 0.500 0.500 7.0006 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.167 0.167 0.167 0.167 1.6437 0.333 0.333 0.500 0.333 0.333 0.500 0.000 1.000 1.000 1.000 1.000 6.3338 0.500 0.500 0.500 0.500 0.500 1.000 1.000 0.000 1.000 0.500 1.000 7.0009 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.000 1.000 0.143 9.143
10 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.143 1.000 0.000 1.000 9.14311 0.500 0.500 0.500 0.500 0.500 1.000 1.000 1.000 0.500 1.000 0.000 7.000Σ 6.643 6.643 7.667 6.643 6.643 7.700 7.343 6.510 6.867 6.867 6.510 76.033
÷ Matricea Cluj Fragmental pe Distanţe, CFD:
o Definiţie: CFDi,j = max|CFDSi,j|; {k}∈CFDSi,j ⇔ d(Gp)k,i<d(Gp)k,j | p∈D(G)i,j, Gp=G\p;
o Referinţe:
÷ Jäntschi L, Katona G, Diudea MV. 2000. Modeling Molecular Properties by Cluj
Indices. Commun Math Comput Chem 41:151-188.
÷ Jäntschi L. 2002. Graph Theory. 1. Fragmentation of Structural Graphs.
Leonardo El J Pract Technol 1(1):19-36.
o Enumerarea seturilor CFDS:
(i,j) p∈D(G)i,j CFDSi,j (1, 2) [1, 2] {1, 5} (2, 1) [2, 1] {2, 3, 6, 7, 8, 9, 10, 11} (1, 3) [1, 2, 3] {1, 5} (3, 1) [3, 2, 1] {3, 4, 6, 7, 8, 9, 10, 11} (1, 4) [1, 5, 4] {1, 2} (4, 1) [4, 5, 1] {3, 4, 6, 7, 8, 9, 10, 11} (1, 5) [1, 5] {1, 2} (5, 1) [5, 1] {4, 5} (1, 6) [1, 2, 3, 6] {1, 4, 5} (6, 1) [6, 3, 2, 1] {6, 7, 8, 9, 10, 11} (1, 7) [1, 2, 3, 6, 9, 8, 7] {1, 4, 5} (7, 1) [7, 8, 9, 6, 3, 2, 1] {7, 10, 11} (1, 7) [1, 2, 3, 6, 10, 11, 7] {1, 4, 5} (7, 1) [7, 11, 10, 6, 3, 2, 1] {7, 8, 9} (1, 8) [1, 2, 3, 6, 9, 8] {1, 4, 5} (8, 1) [8, 9, 6, 3, 2, 1] {7, 8, 10, 11} (1, 9) [1, 2, 3, 6, 9] {1, 4, 5} (9, 1) [9, 6, 3, 2, 1] {7, 8, 9, 10, 11} (1, 10) [1, 2, 3, 6, 10] {1, 4, 5} (10, 1) [10, 6, 3, 2, 1] {7, 8, 9, 10, 11} (1, 11) [1, 2, 3, 6, 10, 11] {1, 4, 5} (11, 1) [11, 10, 6, 3, 2, 1] {7, 8, 9, 11} (2, 3) [2, 3] {1, 2}
(3, 2) [3, 2] {3, 4, 6, 7, 8, 9, 10, 11} (2, 4) [2, 3, 4] {1, 2} (4, 2) [4, 3, 2] {4, 5} (2, 5) [2, 1, 5] {2, 3, 6, 7, 8, 9, 10, 11} (5, 2) [5, 1, 2] {4, 5} (2, 6) [2, 3, 6] {1, 2, 4, 5} (6, 2) [6, 3, 2] {6, 7, 8, 9, 10, 11} (2, 7) [2, 3, 6, 9, 8, 7] {1, 2, 4, 5} (7, 2) [7, 8, 9, 6, 3, 2] {7, 10, 11} (2, 7) [2, 3, 6, 10, 11, 7] {1, 2, 4, 5} (7, 2) [7, 11, 10, 6, 3, 2] {7, 8, 9} (2, 8) [2, 3, 6, 9, 8] {1, 2, 4, 5} (8, 2) [8, 9, 6, 3, 2] {7, 8, 10, 11} (2, 9) [2, 3, 6, 9] {1, 2, 4, 5} (9, 2) [9, 6, 3, 2] {7, 8, 9, 10, 11} (2, 10) [2, 3, 6, 10] {1, 2, 4, 5} (10, 2) [10, 6, 3, 2] {7, 8, 9, 10, 11} (2, 11) [2, 3, 6, 10, 11] {1, 2, 4, 5} (11, 2) [11, 10, 6, 3, 2] {7, 8, 9, 11} (3, 4) [3, 4] {2, 3, 6, 7, 8, 9, 10, 11} (4, 3) [4, 3] {4, 5} (3, 5) [3, 4, 5] {2, 3, 6, 7, 8, 9, 10, 11} (5, 3) [5, 4, 3] {1, 5} (3, 6) [3, 6] {1, 2, 3, 4, 5} (6, 3) [6, 3] {6, 7, 8, 9, 10, 11} (3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5} (7, 3) [7, 11, 10, 6, 3] {7, 8, 9} (3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5} (7, 3) [7, 8, 9, 6, 3] {7, 10, 11} (3, 8) [3, 6, 9, 8] {1, 2, 3, 4, 5} (8, 3) [8, 9, 6, 3] {7, 8, 10, 11} (3, 9) [3, 6, 9] {1, 2, 3, 4, 5} (9, 3) [9, 6, 3] {7, 8, 9, 10, 11} (3, 10) [3, 6, 10] {1, 2, 3, 4, 5} (10, 3) [10, 6, 3] {7, 8, 9, 10, 11} (3, 11) [3, 6, 10, 11] {1, 2, 3, 4, 5} (11, 3) [11, 10, 6, 3] {7, 8, 9, 11} (4, 5) [4, 5] {3, 4, 6, 7, 8, 9, 10, 11} (5, 4) [5, 4] {1, 5} (4, 6) [4, 3, 6] {1, 2, 4, 5} (6, 4) [6, 3, 4] {6, 7, 8, 9, 10, 11} (4, 7) [4, 3, 6, 9, 8, 7] {1, 2, 4, 5} (7, 4) [7, 8, 9, 6, 3, 4] {7, 10, 11} (4, 7) [4, 3, 6, 10, 11, 7] {1, 2, 4, 5} (7, 4) [7, 11, 10, 6, 3, 4] {7, 8, 9} (4, 8) [4, 3, 6, 9, 8] {1, 2, 4, 5} (8, 4) [8, 9, 6, 3, 4] {7, 8, 10, 11} (4, 9) [4, 3, 6, 9] {1, 2, 4, 5} (9, 4) [9, 6, 3, 4] {7, 8, 9, 10, 11} (4, 10) [4, 3, 6, 10] {1, 2, 4, 5}
(10, 4) [10, 6, 3, 4] {7, 8, 9, 10, 11} (4, 11) [4, 3, 6, 10, 11] {1, 2, 4, 5} (11, 4) [11, 10, 6, 3, 4] {7, 8, 9, 11} (5, 6) [5, 4, 3, 6] {1, 2, 5} (6, 5) [6, 3, 4, 5] {6, 7, 8, 9, 10, 11} (5, 7) [5, 4, 3, 6, 9, 8, 7] {1, 2, 5} (7, 5) [7, 8, 9, 6, 3, 4, 5] {7, 10, 11} (5, 7) [5, 4, 3, 6, 10, 11, 7] {1, 2, 5} (7, 5) [7, 11, 10, 6, 3, 4, 5] {7, 8, 9} (5, 8) [5, 4, 3, 6, 9, 8] {1, 2, 5} (8, 5) [8, 9, 6, 3, 4, 5] {7, 8, 10, 11} (5, 9) [5, 4, 3, 6, 9] {1, 2, 5} (9, 5) [9, 6, 3, 4, 5] {7, 8, 9, 10, 11} (5, 10) [5, 4, 3, 6, 10] {1, 2, 5} (10, 5) [10, 6, 3, 4, 5] {7, 8, 9, 10, 11} (5, 11) [5, 4, 3, 6, 10, 11] {1, 2, 5} (11, 5) [11, 10, 6, 3, 4, 5] {7, 8, 9, 11} (6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9} (7, 6) [7, 11, 10, 6] {7, 8} (6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10} (7, 6) [7, 8, 9, 6] {7, 11} (6, 8) [6, 9, 8] {1, 2, 3, 4, 5, 6, 10} (8, 6) [8, 9, 6] {7, 8} (6, 9) [6, 9] {1, 2, 3, 4, 5, 6, 10, 11} (9, 6) [9, 6] {7, 8, 9} (6, 10) [6, 10] {1, 2, 3, 4, 5, 6, 8, 9} (10, 6) [10, 6] {7, 10, 11} (6, 11) [6, 10, 11] {1, 2, 3, 4, 5, 6, 9} (11, 6) [11, 10, 6] {7, 11} (7, 8) [7, 8] {7, 10, 11} (8, 7) [8, 7] {1, 2, 3, 4, 5, 6, 8, 9} (7, 9) [7, 8, 9] {7, 11} (9, 7) [9, 8, 7] {1, 2, 3, 4, 5, 6, 9} (7, 10) [7, 11, 10] {7, 8} (10, 7) [10, 11, 7] {1, 2, 3, 4, 5, 6, 10} (7, 11) [7, 11] {7, 8, 9} (11, 7) [11, 7] {1, 2, 3, 4, 5, 6, 10, 11} (8, 9) [8, 9] {7, 8, 11} (9, 8) [9, 8] {1, 2, 3, 4, 5, 6, 9, 10} (8, 10) [8, 9, 6, 10] {7, 8} (8, 10) [8, 7, 11, 10] {8, 9} (10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10} (8, 11) [8, 7, 11] {8, 9} (11, 8) [11, 7, 8] {10, 11} (9, 10) [9, 6, 10] {8, 9} (10, 9) [10, 6, 9] {10, 11} (11, 9) [11, 10, 6, 9] {7, 11} (9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9} (11, 9) [11, 7, 8, 9] {10, 11} (10, 11) [10, 11] {1, 2, 3, 4, 5, 6, 9, 10}
(11, 10) [11, 10] {7, 8, 11} o Σ(CFD): 237;
o Σ(CFD)2: 889;
o ΣA(CFD): 60.5;
o ΣA(CFD)2: 242;
o Matricea CFD:
CFD 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 2 2 2 2 3 3 3 3 3 3 26 2 8 0 2 2 8 4 4 4 4 4 4 44 3 8 8 0 8 8 5 5 5 5 5 5 62 4 8 2 2 0 8 4 4 4 4 4 4 44 5 2 2 2 2 0 3 3 3 3 3 3 26 6 6 6 6 6 6 0 7 7 8 8 7 67 7 3 3 3 3 3 2 0 3 2 2 3 27 8 4 4 4 4 4 2 8 0 3 2 2 37 9 5 5 5 5 5 3 7 8 0 2 7 52
10 5 5 5 5 5 3 7 7 2 0 8 52 11 4 4 4 4 4 2 8 2 2 3 0 37 Σ 53 41 35 41 53 31 56 46 36 36 46 474
o Σ(RCFD): 15.725;
o Σ(RCFD)2: 4.16(3);
o ΣA(RCFD): 3.308(3);
o ΣA(RCFD)2: 0.78(3);
o Matricea RCFD:
RCFD 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 0.500 0.500 0.500 0.500 0.333 0.333 0.333 0.333 0.333 0.333 4.0002 0.125 0.000 0.500 0.500 0.125 0.250 0.250 0.250 0.250 0.250 0.250 2.7503 0.125 0.125 0.000 0.125 0.125 0.200 0.200 0.200 0.200 0.200 0.200 1.7004 0.125 0.500 0.500 0.000 0.125 0.250 0.250 0.250 0.250 0.250 0.250 2.7505 0.500 0.500 0.500 0.500 0.000 0.333 0.333 0.333 0.333 0.333 0.333 4.0006 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.143 0.125 0.125 0.143 1.5127 0.333 0.333 0.333 0.333 0.333 0.500 0.000 0.333 0.500 0.500 0.333 3.8338 0.250 0.250 0.250 0.250 0.250 0.500 0.125 0.000 0.333 0.500 0.500 3.2089 0.200 0.200 0.200 0.200 0.200 0.333 0.143 0.125 0.000 0.500 0.143 2.244
10 0.200 0.200 0.200 0.200 0.200 0.333 0.143 0.143 0.500 0.000 0.125 2.24411 0.250 0.250 0.250 0.250 0.250 0.500 0.125 0.500 0.500 0.333 0.000 3.208Σ 2.275 3.025 3.400 3.025 2.275 3.533 2.045 2.611 3.325 3.325 2.611 31.450
÷ Matricea Cluj Fragmental pe Detururi, CFΔ:
o Definiţie: CFΔi,j = max|CFΔSi,j|; {k}∈CFΔSi,j ⇔ d(Gp)k,i<d(Gp)k,j | p∈Δ(G)i,j, Gp=G\p;
o Referinţe:
÷ Jäntschi L, Katona G, Diudea MV. 2000. Modeling Molecular Properties by Cluj
Indices. Commun Math Comput Chem 41:151-188.
÷ Jäntschi L. 2002. Graph Theory. 1. Fragmentation of Structural Graphs.
Leonardo El J Pract Technol 1(1):19-36.
o Enumerarea seturilor CFΔS:
(i,j) p∈Δ(G)i,j CFΔSi,j (1, 2) [1, 5, 4, 3, 2] {1} (2, 1) [2, 3, 4, 5, 1] {2} (1, 3) [1, 5, 4, 3] {1} (3, 1) [3, 4, 5, 1] {3, 6, 7, 8, 9, 10, 11} (1, 4) [1, 2, 3, 4] {1} (4, 1) [4, 3, 2, 1] {4} (1, 5) [1, 2, 3, 4, 5] {1} (5, 1) [5, 4, 3, 2, 1] {5} (1, 6) [1, 5, 4, 3, 6] {1, 2} (6, 1) [6, 3, 4, 5, 1] {6, 7, 8, 9, 10, 11} (1, 7) [1, 5, 4, 3, 6, 10, 11, 7] {1, 2} (7, 1) [7, 11, 10, 6, 3, 4, 5, 1] {7, 8, 9} (1, 7) [1, 5, 4, 3, 6, 9, 8, 7] {1, 2} (7, 1) [7, 8, 9, 6, 3, 4, 5, 1] {7, 10, 11} (1, 8) [1, 5, 4, 3, 6, 10, 11, 7, 8] {1, 2} (8, 1) [8, 7, 11, 10, 6, 3, 4, 5, 1] {8, 9} (1, 9) [1, 5, 4, 3, 6, 10, 11, 7, 8, 9] {1, 2} (9, 1) [9, 8, 7, 11, 10, 6, 3, 4, 5, 1] {9} (1, 10) [1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {1, 2} (10, 1) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1] {10} (1, 11) [1, 5, 4, 3, 6, 9, 8, 7, 11] {1, 2} (11, 1) [11, 7, 8, 9, 6, 3, 4, 5, 1] {10, 11} (2, 3) [2, 1, 5, 4, 3] {2} (3, 2) [3, 4, 5, 1, 2] {3, 6, 7, 8, 9, 10, 11} (2, 4) [2, 1, 5, 4] {2} (4, 2) [4, 5, 1, 2] {4} (2, 5) [2, 3, 4, 5] {2} (5, 2) [5, 4, 3, 2] {5} (2, 6) [2, 1, 5, 4, 3, 6] {2} (6, 2) [6, 3, 4, 5, 1, 2] {6, 7, 8, 9, 10, 11} (2, 7) [2, 1, 5, 4, 3, 6, 10, 11, 7] {2} (7, 2) [7, 11, 10, 6, 3, 4, 5, 1, 2] {7, 8, 9} (2, 7) [2, 1, 5, 4, 3, 6, 9, 8, 7] {2} (7, 2) [7, 8, 9, 6, 3, 4, 5, 1, 2] {7, 10, 11} (2, 8) [2, 1, 5, 4, 3, 6, 10, 11, 7, 8] {2} (8, 2) [8, 7, 11, 10, 6, 3, 4, 5, 1, 2] {8, 9} (2, 9) [2, 1, 5, 4, 3, 6, 10, 11, 7, 8, 9] {2} (9, 2) [9, 8, 7, 11, 10, 6, 3, 4, 5, 1, 2] {9} (2, 10) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11, 10] {2} (10, 2) [10, 11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10} (2, 11) [2, 1, 5, 4, 3, 6, 9, 8, 7, 11] {2} (11, 2) [11, 7, 8, 9, 6, 3, 4, 5, 1, 2] {10, 11} (3, 4) [3, 2, 1, 5, 4] {3, 6, 7, 8, 9, 10, 11} (4, 3) [4, 5, 1, 2, 3] {4} (3, 5) [3, 2, 1, 5] {3, 6, 7, 8, 9, 10, 11}
(5, 3) [5, 1, 2, 3] {5} (3, 6) [3, 6] {1, 2, 3, 4, 5} (6, 3) [6, 3] {6, 7, 8, 9, 10, 11} (3, 7) [3, 6, 10, 11, 7] {1, 2, 3, 4, 5} (7, 3) [7, 11, 10, 6, 3] {7, 8, 9} (3, 7) [3, 6, 9, 8, 7] {1, 2, 3, 4, 5} (7, 3) [7, 8, 9, 6, 3] {7, 10, 11} (3, 8) [3, 6, 10, 11, 7, 8] {1, 2, 3, 4, 5} (8, 3) [8, 7, 11, 10, 6, 3] {8, 9} (3, 9) [3, 6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5} (9, 3) [9, 8, 7, 11, 10, 6, 3] {9} (3, 10) [3, 6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5} (10, 3) [10, 11, 7, 8, 9, 6, 3] {10} (3, 11) [3, 6, 9, 8, 7, 11] {1, 2, 3, 4, 5} (11, 3) [11, 7, 8, 9, 6, 3] {10, 11} (4, 5) [4, 3, 2, 1, 5] {4} (5, 4) [5, 1, 2, 3, 4] {5} (4, 6) [4, 5, 1, 2, 3, 6] {4} (6, 4) [6, 3, 2, 1, 5, 4] {6, 7, 8, 9, 10, 11} (4, 7) [4, 5, 1, 2, 3, 6, 10, 11, 7] {4} (7, 4) [7, 11, 10, 6, 3, 2, 1, 5, 4] {7, 8, 9} (4, 7) [4, 5, 1, 2, 3, 6, 9, 8, 7] {4} (7, 4) [7, 8, 9, 6, 3, 2, 1, 5, 4] {7, 10, 11} (4, 8) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8] {4} (8, 4) [8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {8, 9} (4, 9) [4, 5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4} (9, 4) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5, 4] {9} (4, 10) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4} (10, 4) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10} (4, 11) [4, 5, 1, 2, 3, 6, 9, 8, 7, 11] {4} (11, 4) [11, 7, 8, 9, 6, 3, 2, 1, 5, 4] {10, 11} (5, 6) [5, 1, 2, 3, 6] {4, 5} (6, 5) [6, 3, 2, 1, 5] {6, 7, 8, 9, 10, 11} (5, 7) [5, 1, 2, 3, 6, 10, 11, 7] {4, 5} (7, 5) [7, 11, 10, 6, 3, 2, 1, 5] {7, 8, 9} (5, 7) [5, 1, 2, 3, 6, 9, 8, 7] {4, 5} (7, 5) [7, 8, 9, 6, 3, 2, 1, 5] {7, 10, 11} (5, 8) [5, 1, 2, 3, 6, 10, 11, 7, 8] {4, 5} (8, 5) [8, 7, 11, 10, 6, 3, 2, 1, 5] {8, 9} (5, 9) [5, 1, 2, 3, 6, 10, 11, 7, 8, 9] {4, 5} (9, 5) [9, 8, 7, 11, 10, 6, 3, 2, 1, 5] {9} (5, 10) [5, 1, 2, 3, 6, 9, 8, 7, 11, 10] {4, 5} (10, 5) [10, 11, 7, 8, 9, 6, 3, 2, 1, 5] {10} (5, 11) [5, 1, 2, 3, 6, 9, 8, 7, 11] {4, 5} (11, 5) [11, 7, 8, 9, 6, 3, 2, 1, 5] {10, 11} (6, 7) [6, 10, 11, 7] {1, 2, 3, 4, 5, 6, 9} (7, 6) [7, 11, 10, 6] {7, 8} (6, 7) [6, 9, 8, 7] {1, 2, 3, 4, 5, 6, 10} (7, 6) [7, 8, 9, 6] {7, 11} (6, 8) [6, 10, 11, 7, 8] {1, 2, 3, 4, 5, 6}
(8, 6) [8, 7, 11, 10, 6] {8} (6, 9) [6, 10, 11, 7, 8, 9] {1, 2, 3, 4, 5, 6} (9, 6) [9, 8, 7, 11, 10, 6] {9} (6, 10) [6, 9, 8, 7, 11, 10] {1, 2, 3, 4, 5, 6} (10, 6) [10, 11, 7, 8, 9, 6] {10} (6, 11) [6, 9, 8, 7, 11] {1, 2, 3, 4, 5, 6} (11, 6) [11, 7, 8, 9, 6] {11} (7, 8) [7, 11, 10, 6, 9, 8] {7} (8, 7) [8, 9, 6, 10, 11, 7] {8} (7, 9) [7, 11, 10, 6, 9] {7} (9, 7) [9, 6, 10, 11, 7] {9} (7, 10) [7, 8, 9, 6, 10] {7} (10, 7) [10, 6, 9, 8, 7] {10} (7, 11) [7, 8, 9, 6, 10, 11] {7} (11, 7) [11, 10, 6, 9, 8, 7] {11} (8, 9) [8, 7, 11, 10, 6, 9] {8} (9, 8) [9, 6, 10, 11, 7, 8] {9} (8, 10) [8, 9, 6, 10] {7, 8} (8, 10) [8, 7, 11, 10] {8, 9} (10, 8) [10, 11, 7, 8] {1, 2, 3, 4, 5, 6, 10} (8, 11) [8, 9, 6, 10, 11] {8} (11, 8) [11, 10, 6, 9, 8] {11} (9, 10) [9, 8, 7, 11, 10] {9} (10, 9) [10, 11, 7, 8, 9] {10} (11, 9) [11, 10, 6, 9] {7, 11} (9, 11) [9, 8, 7, 11] {1, 2, 3, 4, 5, 6, 9} (11, 9) [11, 7, 8, 9] {10, 11} (10, 11) [10, 6, 9, 8, 7, 11] {10} (11, 10) [11, 7, 8, 9, 6, 10] {11}
o Σ(CFΔ): 128;
o Σ(CFΔ)2: 273;
o ΣA(CFΔ): 27.5;
o ΣA(CFΔ)2: 63;
o Matricea CFΔ:
CFΔ 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 1 1 1 1 2 2 2 2 2 2 16 2 1 0 1 1 1 1 1 1 1 1 1 10 3 7 7 0 7 7 5 5 5 5 5 5 58 4 1 1 1 0 1 1 1 1 1 1 1 10 5 1 1 1 1 0 2 2 2 2 2 2 16 6 6 6 6 6 6 0 7 6 6 6 6 61 7 3 3 3 3 3 2 0 1 1 1 1 21 8 2 2 2 2 2 1 1 0 1 2 1 16 9 1 1 1 1 1 1 1 1 0 1 7 16
10 1 1 1 1 1 1 1 7 1 0 1 16 11 2 2 2 2 2 1 1 1 2 1 0 16 Σ 25 25 19 25 25 17 22 27 22 22 27 256
o Σ(RCFΔ): 37.9(3);
o Σ(RCFΔ)2: 26.6523809;
o ΣA(RCFΔ): 9.492857;
o ΣA(RCFΔ)2: 7.6523809;
o Matricea RCFΔ:
RCFΔ 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 1.000 1.000 1.000 1.000 0.500 0.500 0.500 0.500 0.500 0.500 7.0002 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.0003 0.143 0.143 0.000 0.143 0.143 0.200 0.200 0.200 0.200 0.200 0.200 1.7714 1.000 1.000 1.000 0.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 10.0005 1.000 1.000 1.000 1.000 0.000 0.500 0.500 0.500 0.500 0.500 0.500 7.0006 0.167 0.167 0.167 0.167 0.167 0.000 0.143 0.167 0.167 0.167 0.167 1.6437 0.333 0.333 0.333 0.333 0.333 0.500 0.000 1.000 1.000 1.000 1.000 6.1678 0.500 0.500 0.500 0.500 0.500 1.000 1.000 0.000 1.000 0.500 1.000 7.0009 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.000 1.000 0.143 9.143
10 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.143 1.000 0.000 1.000 9.14311 0.500 0.500 0.500 0.500 0.500 1.000 1.000 1.000 0.500 1.000 0.000 7.000Σ 6.643 6.643 7.500 6.643 6.643 7.700 7.343 6.510 6.867 6.867 6.510 75.867
÷ Matricea Szeged pe Distanţe (SzD) şi Detururi (SzΔ):
o Definiţie:
÷ SzDi,j = |SzDSi,j|; SzDSi,j={k | d(G)k,i<d(G)k,j}
÷ SzΔi,j = |SzΔSi,j|; SzΔSi,j={k | δ(G)k,i<δ(G)k,j}
o Referinţe:
÷ Gutman I. 1994. A Formula for the Wiener Number of Trees and Its Extension to
Graphs Containing Cycles. Graph Theory Notes NY 27:9-15.
÷ Jäntschi L. 2002. Graph Theory. 1. Fragmentation of Structural Graphs.
Leonardo El J Pract Technol 1(1):19-36.
o Enumerarea seturilor SzDS şi SzΔS:
(i,j) SzDSi,j SzDSj,i SzΔSi,j SzΔSj,i (1,2) {1,5} {2,3,6,7,8,9,10,11} {1,3,6,7,8,9,10,11} {2,5} (1,3) {1,5} {3,4,6,7,8,9,10,11} {1,4} {3,5,6,7,8,9,10,11}(2,3) {1,2} {3,4,6,7,8,9,10,11} {2,4} {1,3,6,7,8,9,10,11}(1,4) {1,2} {3,4,6,7,8,9,10,11} {1,3,6,7,8,9,10,11} {2,4} (2,4) {1,2} {4,5} {2,5} {1,4} (3,4) {2,3,6,7,8,9,10,11} {4,5} {3,5,6,7,8,9,10,11} {2,4} (1,5) {1,2} {4,5} {1,4} {2,5} (2,5) {2,3,6,7,8,9,10,11} {4,5} {2,4} {3,5,6,7,8,9,10,11}(3,5) {2,3,6,7,8,9,10,11} {1,5} {1,3,6,7,8,9,10,11} {2,5} (4,5) {3,4,6,7,8,9,10,11} {1,5} {1,4} {3,5,6,7,8,9,10,11}(1,6) {1,2,5} {3,6,7,8,9,10,11} {1,2,4} {3,6,7,8,9,10,11} (2,6) {1,2,5} {6,7,8,9,10,11} {2,4,5} {3,6,7,8,9,10,11} (3,6) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {6,7,8,9,10,11} (4,6) {1,4,5} {6,7,8,9,10,11} {1,2,4} {3,6,7,8,9,10,11} (5,6) {1,4,5} {3,6,7,8,9,10,11} {2,4,5} {3,6,7,8,9,10,11} (1,7) {1,2,3,4,5} {7,8,9,10,11} {1,2,3,4,5} {6,7,8,9,10,11}
(2,7) {1,2,3,4,5,6} {7,8,9,10,11} {1,2,4,5} {6,7,8,9,10,11} (3,7) {1,2,3,4,5,6} {7,8,11} {1,2,3,4,5,6} {7,9,10} (4,7) {1,2,3,4,5,6} {7,8,9,10,11} {1,2,4,5} {6,7,8,9,10,11} (5,7) {1,2,3,4,5} {7,8,9,10,11} {1,2,3,4,5} {6,7,8,9,10,11} (6,7) {1,2,3,4,5,6,9,10} {7,8,11} {1,2,3,4,5,6,8,11} {7,9,10} (1,8) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (2,8) {1,2,3,4,5} {7,8,9,11} {1,2,3,4,5} {6,7,8,9,10,11} (3,8) {1,2,3,4,5,6,10} {7,8,9,11} {1,2,3,4,5,6,7} {8,9,10,11} (4,8) {1,2,3,4,5} {7,8,9,11} {1,2,3,4,5} {6,7,8,9,10,11} (5,8) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (6,8) {1,2,3,4,5,6,10} {7,8} {1,2,3,4,5,6,7} {8,10} (7,8) {7,10,11} {1,2,3,4,5,6,8,9} {1,2,3,4,5,6,7,9} {8,10,11} (1,9) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11} (2,9) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (3,9) {1,2,3,4,5} {7,8,9} {1,2,3,4,5,6} {9,10,11} (4,9) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (5,9) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11} (6,9) {1,2,3,4,5,6,10,11} {7,8,9} {1,2,3,4,5,6,7,8} {9,10,11} (7,9) {7,11} {1,2,3,4,5,6,9} {1,2,3,4,5,6,7} {9,11} (8,9) {7,8,11} {1,2,3,4,5,6,9,10} {1,2,3,4,5,6,8,10} {7,9,11} (1,10) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11} (2,10) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (3,10) {1,2,3,4,5} {7,10,11} {1,2,3,4,5,6} {8,9,10} (4,10) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (5,10) {1,2,4,5} {6,7,8,9,10,11} {1,2,3,4,5,6} {7,8,9,10,11} (6,10) {1,2,3,4,5,6,8,9} {7,10,11} {1,2,3,4,5,6,7,11} {8,9,10} (7,10) {7,8} {1,2,3,4,5,6,10} {1,2,3,4,5,6,7} {8,10} (8,10) {7,8,9} {1,2,3,4,5,6,10,11} {1,2,3,4,5,6,8,11} {7,9,10} (9,10) {8,9} {10,11} {9,11} {8,10} (1,11) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (2,11) {1,2,3,4,5} {7,8,10,11} {1,2,3,4,5} {6,7,8,9,10,11} (3,11) {1,2,3,4,5,6,9} {7,8,10,11} {1,2,3,4,5,6,7} {8,9,10,11} (4,11) {1,2,3,4,5} {7,8,10,11} {1,2,3,4,5} {6,7,8,9,10,11} (5,11) {1,2,3,4,5} {6,7,8,9,10,11} {1,2,3,4,5} {7,8,9,10,11} (6,11) {1,2,3,4,5,6,9} {7,11} {1,2,3,4,5,6,7} {9,11} (7,11) {7,8,9} {1,2,3,4,5,6,10,11} {1,2,3,4,5,6,7,10} {8,9,11} (8,11) {8,9} {10,11} {8,10} {9,11} (9,11) {1,2,3,4,5,6,8,9} {7,10,11} {7,9,10} {1,2,3,4,5,6,8,11} (10,11) {1,2,3,4,5,6,9,10} {7,8,11} {7,8,10} {1,2,3,4,5,6,9,11} o Σ(SzD): 266.5;
o Σ(SzD)2: 1154;
o ΣA(SzD): 60.5;
o ΣA(SzD)2: 242;
o Matricea SzD:
SzD 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 2 2 2 2 3 5 5 4 4 5 34 2 8 0 2 2 8 3 6 5 5 5 5 49 3 8 8 0 8 8 5 6 7 5 5 7 67
4 8 2 2 0 8 3 6 5 5 5 5 49 5 2 2 2 2 0 3 5 5 4 4 5 34 6 7 6 6 6 7 0 8 7 8 8 7 70 7 5 5 3 5 5 3 0 3 2 2 3 36 8 6 4 4 4 6 2 8 0 3 3 2 42 9 6 6 3 6 6 3 7 8 0 2 8 55
10 6 6 3 6 6 3 7 8 2 0 8 55 11 6 4 4 4 6 2 8 2 3 3 0 42 Σ 62 45 31 45 62 30 66 55 41 41 55 533
o Σ(RSzD): 14.15059;
o Σ(RSzD)2: 3.440714;
o ΣA(RSzD): 3.308(3);
o ΣA(RSzD)2: 0.78(3);
o Matricea RSzD:
RSzD 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 0.500 0.500 0.500 0.500 0.333 0.200 0.200 0.250 0.250 0.200 3.4332 0.125 0.000 0.500 0.500 0.125 0.333 0.167 0.200 0.200 0.200 0.200 2.5503 0.125 0.125 0.000 0.125 0.125 0.200 0.167 0.143 0.200 0.200 0.143 1.5524 0.125 0.500 0.500 0.000 0.125 0.333 0.167 0.200 0.200 0.200 0.200 2.5505 0.500 0.500 0.500 0.500 0.000 0.333 0.200 0.200 0.250 0.250 0.200 3.4336 0.143 0.167 0.167 0.167 0.143 0.000 0.125 0.143 0.125 0.125 0.143 1.4467 0.200 0.200 0.333 0.200 0.200 0.333 0.000 0.333 0.500 0.500 0.333 3.1338 0.167 0.250 0.250 0.250 0.167 0.500 0.125 0.000 0.333 0.333 0.500 2.8759 0.167 0.167 0.333 0.167 0.167 0.333 0.143 0.125 0.000 0.500 0.125 2.226
10 0.167 0.167 0.333 0.167 0.167 0.333 0.143 0.125 0.500 0.000 0.125 2.22611 0.167 0.250 0.250 0.250 0.167 0.500 0.125 0.500 0.333 0.333 0.000 2.875Σ 1.885 2.825 3.667 2.825 1.885 3.533 1.561 2.169 2.892 2.892 2.169 28.301
o Σ(SzΔ): 270.5;
o Σ(SzΔ)2: 1188;
o ΣA(SzΔ): 60.5;
o ΣA(SzΔ)2: 242;
o Matricea SzΔ:
SzΔ 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0 8 2 8 2 3 5 5 6 6 5 50 2 2 0 2 2 2 3 4 5 5 5 5 35 3 8 8 0 8 8 5 6 7 6 6 7 69 4 2 2 2 0 2 3 4 5 5 5 5 35 5 2 8 2 8 0 3 5 5 6 6 5 50 6 7 7 6 7 7 0 8 7 8 8 7 72 7 6 6 3 6 6 3 0 8 7 7 8 60 8 5 6 4 6 5 2 3 0 8 8 2 49 9 5 5 3 5 5 3 2 3 0 2 3 36
10 5 5 3 5 5 3 2 3 2 0 3 36 11 5 6 4 6 5 2 3 2 8 8 0 49 Σ 47 61 31 61 47 30 42 50 61 61 50 541
o Σ(RSzΔ): 13.9767857;
o Σ(RSzΔ)2: 3.3592857;
o ΣA(RSzΔ): 3.308(3);
o ΣA(RSzΔ)2: 0.78(3);
o Matricea RSzΔ:
RSzΔ 1 2 3 4 5 6 7 8 9 10 11 Σ 1 0.000 0.125 0.500 0.125 0.500 0.333 0.200 0.200 0.167 0.167 0.200 2.5172 0.500 0.000 0.500 0.500 0.500 0.333 0.250 0.200 0.200 0.200 0.200 3.3833 0.125 0.125 0.000 0.125 0.125 0.200 0.167 0.143 0.167 0.167 0.143 1.4864 0.500 0.500 0.500 0.000 0.500 0.333 0.250 0.200 0.200 0.200 0.200 3.3835 0.500 0.125 0.500 0.125 0.000 0.333 0.200 0.200 0.167 0.167 0.200 2.5176 0.143 0.143 0.167 0.143 0.143 0.000 0.125 0.143 0.125 0.125 0.143 1.3997 0.167 0.167 0.333 0.167 0.167 0.333 0.000 0.125 0.143 0.143 0.125 1.8698 0.200 0.167 0.250 0.167 0.200 0.500 0.333 0.000 0.125 0.125 0.500 2.5679 0.200 0.200 0.333 0.200 0.200 0.333 0.500 0.333 0.000 0.500 0.333 3.133
10 0.200 0.200 0.333 0.200 0.200 0.333 0.500 0.333 0.500 0.000 0.333 3.13311 0.200 0.167 0.250 0.167 0.200 0.500 0.333 0.500 0.125 0.125 0.000 2.567Σ 2.735 1.918 3.667 1.918 2.735 3.533 2.858 2.377 1.918 1.918 2.377 27.954
÷ Produsul Hadamard a două matrici H(·,·):
o Definiţie: H(A,B)i,j=Ai,j·Bi,j;
o Aplicaţii:
Hadamard CJD CJΔ CFD CFΔ SzD SzΔ D H(D,CJD) H(D,CJΔ) H(D,CFD) H(D,CFΔ) H(D,SzD) H(D,SzΔ) Δ H(Δ,CJD) H(Δ,CJΔ) H(Δ,CFD) H(Δ,CFΔ) H(Δ,SzD) H(Δ,SzΔ)
o Indici pe matricile Hadamard:
H(·,·) Σ(·) Σ(·)2 ΣA(·) ΣA(·)2 Σ(1/(·)) Σ(1/(·))2 ΣA(1/(·))2 ΣA(1/(·))2 H(D,CJD) 600 6954 60.5 242 7.971 1.315 3.308 0.783 H(D,CJΔ) 347 2491 27.5 63 19.834 10.582 9.493 7.652 H(D,CFD) 622 7616 60.5 242 7.717 1.278 3.308 0.783 H(D,CFΔ) 349 2571 27.5 63 19.813 10.580 9.493 7.652 H(D,SzD) 756 13048 60.5 242 7.389 1.250 3.308 0.783 H(D,SzΔ) 769 13500 60.5 242 7.333 1.238 3.308 0.783 H(Δ,CJD) 1292 32244 258.5 4718 3.574 0.255 0.896 0.075 H(Δ,CJΔ) 653 6885 104.5 702 7.676 1.243 2.252 0.412 H(Δ,CFD) 1338 35082 258.5 4718 3.437 0.244 0.896 0.075 H(Δ,CFΔ) 655 6965 104.5 702 7.655 1.241 2.252 0.412 H(Δ,SzD) 1564 51568 258.5 4718 3.189 0.224 0.896 0.075 H(Δ,SzΔ) 1592 53560 258.5 4718 3.166 0.222 0.896 0.075
÷ Produsul Schultz a două matrici S(·,A,·):
o Definiţie: S(X,A,Y)i,j=X(A+Y);
o Aplicaţii:
Schultz CJD CJΔ CFD CFΔ SzD SzΔ A S(A,A,CJD) S(A,A,CJΔ) S(A,A,CFD) S(A,A,CFΔ) S(A,A,SzD) S(A,A,SzΔ)D S(D,A,CJD) S(D,A,CJΔ) S(D,A,CFD) S(D,A,CFΔ) S(D,A,SzD) S(D,A,SzΔ)Δ S(Δ,A,CJD) S(Δ,A,CJΔ) S(Δ,A,CFD) S(Δ,A,CFΔ) S(Δ,A,SzD) S(Δ,A,SzΔ)o Indici pe matricile Schultz:
S(·,A,·) Σ(·) Σ(·)2 ΣA(·) ΣA(·)2 Σ(1/(·)) Σ(1/(·))2 ΣA(1/(·))2 ΣA(1/(·))2
S(A,A,CJD) 550.5 4833.5 61 248 8.76175 1.31487 3.47024 0.72197S(A,A,CJΔ) 341.5 1987.5 35 59 16.89960 6.16609 8.11905 4.48810S(A,A,CFD) 565.5 5205.5 64 292 8.46774 1.26196 3.41607 0.70670S(A,A,CFΔ) 342.5 2003.5 35 59 16.81627 6.14526 8.11905 4.48810S(A,A,SzD) 628.5 6339.5 61 248 7.90838 1.13978 3.47024 0.72197S(A,A,SzΔ) 638.5 7171.5 63 342 7.49169 1.45677 3.43849 1.08596S(D,A,CJD) 6358.5 728779 1215 137976 0.57811 0.00663 0.13649 0.00177S(D,A,CJΔ) 3573.5 217760 712 45023 1.01352 0.01929 0.22652 0.00467S(D,A,CFD) 6576 764461 1278.5 147548 0.55208 0.00590 0.12597 0.00145S(D,A,CFΔ) 3591 219152 718.5 45529 1.00766 0.01898 0.22338 0.00450S(D,A,SzD) 7440 1002756 1515.5 219149 0.49894 0.00496 0.11222 0.00123S(D,A,SzΔ) 7786 1016184 1548.5 208403 0.47479 0.00423 0.10478 0.00102S(Δ,A,CJD) 13560.5 3120452 2446 527736 0.27149 0.00139 0.06576 0.00039S(Δ,A,CJΔ) 7227.5 887001 1330 150684 0.50828 0.00483 0.12147 0.00126S(Δ,A,CFD) 14022 3290896 2598.5 573094 0.25910 0.00124 0.06093 0.00032S(Δ,A,CFΔ) 7255 890817 1339.5 151878 0.50613 0.00476 0.12055 0.00123S(Δ,A,SzD) 15724 4220049 2992.5 802176 0.23648 0.00106 0.05506 0.00028S(Δ,A,SzΔ) 15684 4367127 2991.5 792573 0.23389 0.00108 0.05216 0.00025
Polinoame
Polinoamele au aplicaţii importante în topologia moleculară. Următoarele polinoame sunt
definite:
÷ Polinomul caracteristic (ChP) asociat unui graf G [Bolboacă SD, Jäntschi L. 2007. How Good
the Characteristic Polynomial Can Be for Correlations? Int J Mol Sci 8(4):335-345] se obţine pe
baza matricii de adiacenţă A=A(G) astfel: ChP(G,X)=det[XI-A(G)]
÷ Polinoamele de numărare (CDi, CMx, CcM, CSz, CCf) se definesc astfel [Jäntschi L. 2007.
Characteristic and Counting Polynomials of Nonane Isomers. Cluj: AcademicDirect, p. 101]:
C(G,M,X) = Σk≥0|{Mi,j , |Mi,j| = k}|Xk, unde M=D, Mx, cM, Sz, Cf.
În tabelul 10 este redată matricea caracteristică, iar în Tabelele 11-15 sunt redate matricile
de numărare CDi, CMx, CcM, CSz, CCf asociate grafului molecular din Tabelul 9.
Tabelul 10. Matricea caracteristică a grafului molecular din Tabelul 9 [Ch] 1 2 3 4 5 6 7 8 9 10 11 1 X -1 0 0 -1 0 0 0 0 0 0 2 -1 X -1 0 0 0 0 0 0 0 0 3 0 -1 X -1 0 -1 0 0 0 0 0 4 0 0 -1 X -1 0 0 0 0 0 0 5 -1 0 0 -1 X 0 0 0 0 0 0 6 0 0 -1 0 0 X 0 0 -1 -1 0 7 0 0 0 0 0 0 X -1 0 0 -1 8 0 0 0 0 0 0 -1 X -1 0 0 9 0 0 0 0 0 -1 0 -1 X 0 0 10 0 0 0 0 0 -1 0 0 0 X -1 11 0 0 0 0 0 0 -1 0 0 -1 X ChP X11 - 12X9 + 51X7 - 2X6 - 95X5 + 12X4 + 78X3 - 18X2 - 23X1 + 8
Tabelul 11. Matricea de numărare pe distanţe a grafului molecular din Tabelul 9 [Di] 1 2 3 4 5 6 7 8 9 10 11 1 0 1 2 2 1 3 6 5 4 4 5 2 1 0 1 2 2 2 5 4 3 3 4 3 2 1 0 1 2 1 4 3 2 2 3 4 2 2 1 0 1 2 5 4 3 3 4 5 1 2 2 1 0 3 6 5 4 4 5 6 3 2 1 2 3 0 3 2 1 1 2 7 6 5 4 5 6 3 0 1 2 2 1 8 5 4 3 4 5 2 1 0 1 3 2 9 4 3 2 3 4 1 2 1 0 2 3 10 4 3 2 3 4 1 2 3 2 0 1 11 5 4 3 4 5 2 1 2 3 1 0 CDi 4X6 + 12X5 + 18X4 + 22X3 + 30X2 + 24X1 + 11
Tabelul 12. Matricea fragmentelor maximale pentru graful molecular din Tabelul 9
[Mx] 1 2 3 4 5 6 7 8 9 10 11 1 1 3 4 5
6 7 8 9 10 11
1 2 4 5
1 2 3 5 6 7 8 9 10 11
1 2 3 4 6 7 8 9 10 11
1 2 3 4 5
1 2 3 4 5 6 8 9 10 11
1 2 3 4 5 6 7 9 10 11
1 2 3 4 5 6 7 8 10 11
1 2 3 4 5 6 7 8 9 11
1 2 3 4 5 6 7 8 9 10
2 2 3 4 5 6 7 8 9 10 11
1 2 4 5
1 2 3 5 6 7 8 9 10 11
1 2 3 4 6 7 8 9 10 11
1 2 3 4 5
1 2 3 4 5 6 8 9 10 11
1 2 3 4 5 6 7 9 10 11
1 2 3 4 5 6 7 8 10 11
1 2 3 4 5 6 7 8 9 11
1 2 3 4 5 6 7 8 9 10
3 2 3 4 5 6 7 8 9 10 11
1 3 4 5 6 7 8 9 10 11
1 2 3 5 6 7 8 9 10 11
1 2 3 4 6 7 8 9 10 11
1 2 3 4 5
1 2 3 4 5 6 8 9 10 11
1 2 3 4 5 6 7 9 10 11
1 2 3 4 5 6 7 8 10 11
1 2 3 4 5 6 7 8 9 11
1 2 3 4 5 6 7 8 9 10
4 2 3 4 5 6 7 8 9 10 11
1 3 4 5 6 7 8 9 10 11
1 2 4 5
1 2 3 4 6 7 8 9 10 11
1 2 3 4 5
1 2 3 4 5 6 8 9 10 11
1 2 3 4 5 6 7 9 10 11
1 2 3 4 5 6 7 8 10 11
1 2 3 4 5 6 7 8 9 11
1 2 3 4 5 6 7 8 9 10
5 2 3 4 5 6 7 8 9 10 11
1 3 4 5 6 7 8 9 10 11
1 2 4 5
1 2 3 5 6 7 8 9 10 11
1 2 3 4 5
1 2 3 4 5 6 8 9 10 11
1 2 3 4 5 6 7 9 10 11
1 2 3 4 5 6 7 8 10 11
1 2 3 4 5 6 7 8 9 11
1 2 3 4 5 6 7 8 9 10
6 2 3 4 5 6 7 8 9 10 11
1 3 4 5 6 7 8 9 10 11
6 7 8 9 10 11
1 2 3 5 6 7 8 9 10 11
1 2 3 4 6 7 8 9 10 11
1 2 3 4 5 6 8 9 10 11
1 2 3 4 5 6 7 9 10 11
1 2 3 4 5 6 7 8 10 11
1 2 3 4 5 6 7 8 9 11
1 2 3 4 5 6 7 8 9 10
7 2 3 4 5 6 7 8 9 10 11
1 3 4 5 6 7 8 9 10 11
6 7 8 9 10 11
1 2 3 5 6 7 8 9 10 11
1 2 3 4 6 7 8 9 10 11
7 8 9 10 11
1 2 3 4 5 6 7 9 10 11
1 2 3 4 5 6 7 8 10 11
1 2 3 4 5 6 7 8 9 11
1 2 3 4 5 6 7 8 9 10
8 2 3 4 5 6 7 8 9 10 11
1 3 4 5 6 7 8 9 10 11
6 7 8 9 10 11
1 2 3 5 6 7 8 9 10 11
1 2 3 4 6 7 8 9 10 11
7 8 9 10 11
1 2 3 4 5 6 8 9 10 11
1 2 3 4 5 6 7 8 10 11
1 2 3 4 5 6 7 8 9 11
1 2 3 4 5 6 7 8 9 10
9 2 3 4 5 6 7 8 9 10 11
1 3 4 5 6 7 8 9 10 11
6 7 8 9 10 11
1 2 3 5 6 7 8 9 10 11
1 2 3 4 6 7 8 9 10 11
7 8 9 10 11
1 2 3 4 5 6 8 9 10 11
1 2 3 4 5 6 7 9 10 11
1 2 3 4 5 6 7 8 9 11
1 2 3 4 5 6 7 8 9 10
10 2 3 4 5 6 7 8 9 10 11
1 3 4 5 6 7 8 9 10 11
6 7 8 9 10 11
1 2 3 5 6 7 8 9 10 11
1 2 3 4 6 7 8 9 10 11
7 8 9 10 11
1 2 3 4 5 6 8 9 10 11
1 2 3 4 5 6 7 9 10 11
1 2 3 4 5 6 7 8 10 11
1 2 3 4 5 6 7 8 9 10
11 2 3 4 5 6 7 8 9 10 11
1 3 4 5 6 7 8 9 10 11
6 7 8 9 10 11
1 2 3 5 6 7 8 9 10 11
1 2 3 4 6 7 8 9 10 11
7 8 9 10 11
1 2 3 4 5 6 8 9 10 11
1 2 3 4 5 6 7 9 10 11
1 2 3 4 5 6 7 8 10 11
1 2 3 4 5 6 7 8 9 11
CMx 90X10 + 6X6 + 10X5 + 4X4 +11
Tabelul 13. Matricea fragmentelor complement-maximale pentru graful molecular din Tabelul 9 [cM] 1 2 3 4 5 6 7 8 9 10 11 1 2 3 6 7 8 9 10 11 4 5 6 7 8 9 10 11 7 8 9 10 11 2 1 3 6 7 8 9 10 11 4 5 6 7 8 9 10 11 7 8 9 10 11 3 1 2 4 5 6 7 8 9 10 11 7 8 9 10 11 4 1 2 3 6 7 8 9 10 11 5 6 7 8 9 10 11 7 8 9 10 11 5 1 2 3 6 7 8 9 10 11 4 6 7 8 9 10 11 7 8 9 10 11 6 1 2 1 2 3 4 5 4 5 7 8 9 10 11 7 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 8 9 10 11 8 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 9 10 11 9 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 8 10 11 10 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 8 9 11 11 1 2 1 2 3 4 5 4 5 1 2 3 4 5 6 7 8 9 10 CcM 4X7 + 10X6 + 6X5 + 90X1 + 11
Tabelul 14. Matricea fragmentelor Szged pentru graful molecular din Tabelul 9
[Sz] 1 2 3 4 5 6 7 8 9 10 11 1 1 5 1 5 1 2 1 2 1 2
5 1 2 3 4 5
1 2 3 4 5
1 2 4 5 1 2 4 5 1 2 3 4 5
2 2 3 6 7 8 9 10 11
1 2 1 2 2 3 6 7 8 9 10 11
1 2 5
1 2 3 4 5 6
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
3 3 4 6 7 8 9 10 11
3 4 6 7 8 9 10 11
2 3 6 7 8 9 10 11
2 3 6 7 8 9 10 11
1 2 3 4 5
1 2 3 4 5 6
1 2 3 4 5 6 10
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5 6 9
4 3 4 6 7 8 9 10 11
4 5 4 5 3 4 6 7 8 9 10 11
1 4 5
1 2 3 4 5 6
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
5 4 5 4 5 1 5 1 5 1 4 5
1 2 3 4 5
1 2 3 4 5
1 2 4 5 1 2 4 5 1 2 3 4 5
6 3 6 7 8 9 10 11
6 7 8 9 10 11
6 7 8 9 10 11
6 7 8 9 10 11
3 6 7 8 9 10 11
1 2 3 4 5 6 9 10
1 2 3 4 5 6 10
1 2 3 4 5 6 10 11
1 2 3 4 5 6 8 9
1 2 3 4 5 6 9
7 7 8 9 10 11
7 8 9 10 11
7 8 11 7 8 9 10 11
7 8 9 10 11
7 8 11
7 10 11 7 11 7 8 7 8 9
8 6 7 8 9 10 11
7 8 9 11
7 8 9 11
7 8 9 11
6 7 8 9 10 11
7 8 1 2 3 4 5 6 8 9
7 8 11 7 8 9 8 9
9 6 7 8 9 10 11
6 7 8 9 10 11
7 8 9 6 7 8 9 10 11
6 7 8 9 10 11
7 8 9
1 2 3 4 5 6 9
1 2 3 4 5 6 9 10
8 9 1 2 3 4 5 6 8 9
10 6 7 8 9 10 11
6 7 8 9 10 11
7 10 11
6 7 8 9 10 11
6 7 8 9 10 11
7 10 11
1 2 3 4 5 6 10
1 2 3 4 5 6 10 11
10 11 1 2 3 4 5 6 9 10
11 6 7 8 9 10 11
7 8 10 11
7 8 10 11
7 8 10 11
6 7 8 9 10 11
7 11 1 2 3 4 5 6 10 11
10 11 7 10 11 7 8 11
CSz 17X8 + 8X7 + 18X6 + 21X5 + 10X4 + 16X3 + 20X2 + 11
Tabelul 15. Matricea fragmentelor Cluj pentru graful molecular din Tabelul 9 [Cf] 1 2 3 4 5 6 7 8 9 10 11 1 1 5 1 5 1 2 1 2 1 4
5 1 4 5 1 4 5 1 4 5 1 4 5 1 4 5
2 2 3 6 7 8 9 10 11
1 2 1 2 2 3 6 7 8 9 10 11
1 2 4 5
1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5
3 3 4 6 7 8 9 10 11
3 4 6 7 8 9 10 11
2 3 6 7 8 9 10 11
2 3 6 7 8 9 10 11
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
1 2 3 4 5
4 3 4 6 7 8 9 10 11
4 5 4 5 3 4 6 7 8 9 10 11
1 2 4 5
1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5 1 2 4 5
5 4 5 4 5 1 5 1 5 1 2 5
1 2 5 1 2 5 1 2 5 1 2 5 1 2 5
6 6 7 8 9 10 11
6 7 8 9 10 11
6 7 8 9 10 11
6 7 8 9 10 11
6 7 8 9 10 11
1 2 3 4 5 6 10
1 2 3 4 5 6 10
1 2 3 4 5 6 10 11
1 2 3 4 5 6 8 9
1 2 3 4 5 6 9
7 7 10 11 7 10 11 7 10 11
7 10 11 7 10 11 7 11 7 10 11 7 11 7 8 7 8 9
8 7 8 10 11
7 8 10 11
7 8 10 11
7 8 10 11
7 8 10 11
7 8 1 2 3 4 5 6 8 9
7 8 11 8 9 8 9
9 7 8 9 10 11
7 8 9 10 11
7 8 9 10 11
7 8 9 10 11
7 8 9 10 11
7 8 9
1 2 3 4 5 6 9
1 2 3 4 5 6 9 10
8 9 1 2 3 4 5 6 9
10 7 8 9 10 11
7 8 9 10 11
7 8 9 10 11
7 8 9 10 11
7 8 9 10 11
7 10 11
1 2 3 4 5 6 10
1 2 3 4 5 6 10
10 11 1 2 3 4 5 6 9 10
11 7 8 9 11 7 8 9 11 7 8 9 11
7 8 9 11 7 8 9 11 7 11 1 2 3 4 5 6 10 11
10 11 10 11 7 8 11
CCf 14X8 + 7X7 + 5X6 + 16X5 + 22X4 + 23X3 + 23X2 +11
Chimie Cuantică
Se bazează pe modelul ondulatoriu al mecanicii atomilor şi moleculelor propus de
Schrödinger în 1926 [An Undulatory Theory of the Mechanics of Atoms and Molecules, Phys Rev, 28(6),
1049-1070]. Două forme ale ecuaţiei lui Schrödinger sunt folosite (una dependentă de timp şi
cealaltă independentă de timp), dintre care ecuaţia independentă de timp (EΨ = ĤΨ) răspunde
problematicii structurii chimice la echilibru, şi anume:
÷ Unde sunt electronii şi nucleele unei molecule localizaţi în spaţiu? - şi din răspunsul la această
întrebare derivă o serie de consecinţe cum sunt: configuraţia, conformaţia, mărimea, forma, etc.
÷ Sub un set dat de condiţii (de mediu) care sunt energiile (atomilor şi moleculelor)? - şi din
răspunsul la această întrebare rezultă o serie de proprietăţi moleculare: căldura de formare,
stabilitatea conformaţională, reactivitatea chimică, proprietăţile spectrale, etc.
Termodinamica stabileşte relaţii cantitative între variabile macroscopice (volum, presiune,
temperatură, concentraţie) ce definesc un sistem fizico-chimic de proporţii mari, comparativ cu
dimensiunile corpusculilor constituenţi (atomi, molecule, etc.). Tipul de sistem este determinat de
caracteristicile suprafeţei de separare:
÷ sistem deschis / închis - materia poate fi / nu poate fi transferată prin suprafaţa de separare;
o sistemele închise şi deschise pot schimba energie cu mediul înconjurător;
÷ sistem izolat - sistem închis care nu este în contact mecanic şi termic cu mediul înconjurător;
÷ proces - transformare de stare (dilatare, răcire) sau transformare în starea fizică (topire,
solidificare) sau transformare chimică complexă (se formează noi substanţe).
÷ lucru este efectuat de sistem dacă în urma unui proces rezultă o energie cu care poate fi ridicată
o greutate în mediu.
Energia unui sistem poate varia şi ca urmare a unui transfer de căldură:
÷ proces exoterm - proces în care se degajă energie sub formă de căldură;
÷ proces endoterm - proces care absoarbe energie sub formă de căldură;
÷ proces adiabatic - proces care se desfăşoară într-un sistem izolat adiabatic;
o suprafeţele de separare adiabatice - nu permit transferul de căldură;
Mişcarea haotică a moleculelor se numeşte mişcare termică. Din punct de vedere molecular,
lucrul este transferul de energie datorită mişcării ordonate. Distincţia între căldură şi lucru se
realizează în mediu. Din punct de vedere molecular, cele două noţiuni pot fi definite astfel:
÷ Lucrul este transferul de energie ce foloseşte mişcarea ordonată a atomilor din mediu;
÷ Căldura este transferul de energie ce foloseşte mişcarea termică a atomilor din mediu.
Principiul I al termodinamicii introduce noţiunea de energie internă:
÷ Energia internă U este energia totală a unui sistem. Ea este o funcţie de stare: ΔU = Uf - Ui
÷ U este o funcţie de proprietăţile care determină starea sistemului la un moment dat şi
independentă de calea prin care s-a ajuns la starea respectivă: U = U(n,p,...)
÷ Căldura şi lucrul sunt căi echivalente pentru variaţia energiei interne a unui sistem. Dacă un
sistem este izolat de mediul înconjurător atunci nu are loc nici o variaţie de energie internă, sau,
nu există nici o maşină care efectuează lucru mecanic fără consum energetic (perpetuum mobile
de speţa I): energia internă a unui sistem izolat este constantă (Principiul I);
Formularea principiului I nu menţionează căldura, însă o implică şi permite o definire a
căldurii pe baza lucrului.
Fie două stări ale unui sistem, U1 şi U2 şi fie două transformări, una adiabatică şi una oarecare.
Pentru transformarea adiabatică avem (conservarea energiei pentru sistem): ΔU = U2 - U1 = wad iar
pentru transformarea oarecare avem (conservarea energiei pentru sistem): ΔU = U2 - U1 = w + q,
unde q este cantitatea de energie neexplicată prin lucru sau energie internă. Diferenţa wad-w este
pusă pe seama căldurii absorbite de sistem (conservarea energiei pentru mediu): q = wad - w, de
unde: q = ΔU - w. Concluzionând, variaţia de energie internă ΔU depinde de energia transferată
unui sistem sub formă de căldură q şi lucrul efectuat asupra unui sistem w prin: ΔU = q + w. Dacă
se consideră variaţii infinitezimale, avem: dU = dq + dw. Transformarea pe care o suferă sistemul
este cvasistatică dacă mişcarea sa este atât de lentă comparativ cu procesele care disipează energie
şi materie în mediu încât peste tot în sistem presiunea şi temperatura sunt independente de spaţiu
(pot fi însă dependente de timp).
Dacă descompunem dw în dw = dwe + dwexp unde dwexp lucrul mecanic de expansiune şi
dwe un lucru mecanic suplimentar necauzat de expansiune, atunci: dU = dq + dwe + dwexp. Astfel,
pentru sistemele ce evoluează la volum constant dwexp = 0; pentru sistemele care nu efectuează nici
un fel de lucru (electric, optic, etc) şi dwe = 0; în aceste condiţii: dU = dq (la volum constant, fără
lucru suplimentar). Pentru o transformare finită: ΔU = q, deci prin măsurarea energiei primite de la
un sistem la volum constant sub formă de căldură (q>0) sau obţinută de el sub formă de căldură
(q<0) în timpul unei transformări de stare, se măsoară de fapt variaţia energiei sale interne ΔU.
De obicei perechea de variabile de stare independente: temperatura şi presiunea reprezintă
condiţiile fireşti de desfăşurare ale reacţiilor chimice şi proceselor fizico-chimice. Multe procese au
loc în condiţii de presiune atmosferică şi temperatură ambiantă.
Astfel, adaptând principiul I al termodinamicii la condiţiile menţionate mai sus, a luat
naştere o nouă funcţie de stare numită entalpie, care se notează cu H şi care însumează energia
internă cu lucrul mecanic necesar pentru ocuparea de către sistem a volumului său propriu V la
presiunea de lucru p: H = U + pV. O variaţie de entalpie este egală cu căldura absorbită la
temperatură constantă de către sistem atâta timp cât sistemul nu efectuează şi lucru suplimentar: dH
= dq = dU (la presiune constantă, fără lucru suplimentar). Pentru o transformare finită: ΔH = qv,p.
Proprietăţile unei probe independente de modul în care se obţine proba se numesc funcţii de
stare. Ele pot fi privite ca fiind funcţie de alţi parametri fundamentali, ca presiunea, temperatura şi
volumul, care descriu starea curentă a sistemului. Energia internă, entalpia şi capacitatea calorică
sunt funcţii de stare. Proprietăţile legate de prepararea stării se numesc funcţii de drum. Lucrul
efectuat pentru prepararea unei stări, energia transferată sub formă de căldură sunt funcţii de drum.
Lucrul şi căldura sunt funcţii de proces. Exprimând acum matematic această afirmaţie,
avem:
ΔU = , dU diferenţială exactă; ΔH = , dH diferenţială exactă 12
2
1
UUdU −=∫ 12
2
1
HHdH −=∫
Prin diferenţială exactă înţelegem o mărime infinitezimală care prin integrare conduce la un
rezultat independent de drumul dintre starea iniţială şi finală. Astfel:
q = , dq diferenţială inexactă; w = , dw diferenţială inexactă ∫γ ]2,1[
dq ∫γ ]2,1[
dw
Prin diferenţială inexactă înţelegem o mărime infinitezimală care prin integrare conduce la un
rezultat care depinde de drumul dintre starea iniţială şi finală.
Fie o funcţie de stare f = f(x,y) şi z o altă funcţie de stare z = z(x,y). Avem:
xyf
yxf 22
∂∂∂
=∂∂
∂ ⇒ zxy
z
xy
z xy
yf
xf
x
dyyfdx
xf
xf
⎟⎠⎞
⎜⎝⎛∂∂
⋅⎟⎟⎠
⎞⎜⎜⎝
⎛∂∂
+⎟⎠⎞
⎜⎝⎛∂∂
=
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
∂
⎟⎟⎠
⎞⎜⎜⎝
⎛∂∂
+⎟⎠⎞
⎜⎝⎛∂∂
=⎟⎠⎞
⎜⎝⎛∂∂
zz xy1
yx
⎟⎠⎞
⎜⎝⎛∂∂
=⎟⎟⎠
⎞⎜⎜⎝
⎛∂∂ ,
xyz zy
zx
yx
⎟⎠⎞
⎜⎝⎛∂∂
⋅⎟⎠⎞
⎜⎝⎛∂∂
−=⎟⎟⎠
⎞⎜⎜⎝
⎛∂∂ , 1
xz
zy
yx
yxz
−=⎟⎠⎞
⎜⎝⎛∂∂
⋅⎟⎠⎞
⎜⎝⎛∂∂
⋅⎟⎟⎠
⎞⎜⎜⎝
⎛∂∂
Următoarea relaţie ne spune dacă df = g(x,y)dx + h(x,y)dy este sau nu o diferenţială totală
(adică provine dintr-o funcţie de stare):
df = g(x,y)dx + h(x,y)dy diferenţială totală ⇔ yx x
hyg
⎟⎠⎞
⎜⎝⎛∂∂
=⎟⎟⎠
⎞⎜⎜⎝
⎛∂∂
Primele studii asupra unei maşini termice care ar funcţiona după un ciclu format din patru
etape reversibile: (a) dilatare izotermă (T = TA); (b) dilatare adiabatică (q = 0); (c) comprimare
izotermă (T = TC); (d) comprimare adiabatică (q = 0), au fost efectuate de inginerul francez Sadi
Carnot. Se numeşte ciclu Carnot, un ciclu format din cele patru etape reversibile (a), (b), (c) şi (d).
Se numeşte maşină Carnot o maşină care ar funcţiona după un ciclu Carnot.
Exprimând lucrul şi energia în cele patru transformări, ţinând seama de evoluţia sistemului:
÷ ΔUAB = 0; qAB = -wAB; wAB = - ∫ ⋅B
-A
V
V
dVp =A
BA V
VlnnRT ⋅
÷ qBC = 0; wBC = - ∫ ⋅C
= ΔUBC; ΔUBC = CV(TC-TB) B
V
V
dVp
÷ ΔUCD = 0; qCD = -wCD; wCD = - ∫ ⋅D
-C
V
V
dVp =C
DC V
VlnnRT ⋅
÷ qDA = 0; wDA = - ∫ ⋅A
= ΔUDA; ΔUDA = CV(TB-TC) D
V
V
dVp
Ţinând cont că se defineşte randamentul unei maşini termice prin η=Lefectuat/qabsorbită,
exprimând randamentul pentru un ciclu Carnot, ciclu format din cele patru etape reversibile:
η = AB
CDAB
qww +
= AB
CDAB
qww +− =
AB
CDAB
qqq − = 1 -
AB
CD
qq =
A
BA
D
CC
VVlnT
VVlnT
1⋅
⋅− = 1-
A
C
TT
În expresia randamentului ciclului Carnot se poate observa că dacă temperatura sursei reci ar
fi 0K (TC = 0K) atunci randamentul este ηCarnot = 1 (perpetuum mobile de speţa a II-a). Condiţia ca
maşina Carnot să funcţioneze este ca TA > TC (pentru TC = TA ⇒ ηCarnot = 0).
Unele procese au loc natural, de la sine, altele nu. Un gaz se dilată pentru a umple volumul
disponibil, un corp cald se răceşte la temperatura mediului său înconjurător, iar o reacţie chimică
decurge de preferinţă într-o anumită direcţie.
Sensul transformărilor spontane este sensul care nu necesită efectuarea unui lucru pentru
realizarea procesului.
Se poate aduce un gaz la volum mai mic, se poate răci şi se pot aduce unele reacţii să
decurgă în sens invers (electroliza apei) dar nici unul dintre aceste procese nu are loc spontan;
fiecare se poate produce numai prin efectuarea unui lucru.
Distincţia între cele două tipuri de procese, spontane şi nespontane formează obiectul
principiului al doilea al termodinamicii: nu este posibil un proces al cărui unic rezultat este
absorbţia de căldură de la un rezervor şi transformarea sa completă în lucru. Într-un sistem izolat
sensul unui proces nu poate fi determinat de energia sa totală. Principiul I stabileşte că energia se
conservă şi nu se poate afirma că în orice proces sistemul tinde către o stare cu minim de energie,
deoarece într-un sistem izolat energia totală este constantă. Când are loc un proces, energia totală a
unui sistem izolat rămâne constantă, însă se distribuie în moduri diferite. Astfel, se poate corela
sensul de desfăşurare a proceselor cu modul de distribuire a energiei.
Astfel, procesele spontane sunt întotdeauna însoţite de o disipare a energiei într-o formă
mai dezordonată.
Principiul I a condus la introducerea energiei interne U. Energia internă ca funcţie de stare
ne permite să stabilim dacă un proces este posibil; într-un sistem izolat pot avea loc numai acele
procese (reprezentate în diagrama energetică U = U(T,V), de exemplu) în care energia internă
rămâne constantă (suprafaţa de energie internă U constantă). Principiul al II-lea care permite
aprecierea sensului proceselor spontane, poate fi formulat printr-o altă funcţie de stare, entropia S.
Entropia arată dacă o stare a unui sistem este accesibilă din alta în mod spontan. Într-un
sistem izolat entropia creşte în procesele spontane ΔStot > 0, unde ΔStot este entropia totală a
sistemului izolat care conţine sistemul de analizat. Definiţia riguroasă a entropiei se poate face pe
baza termodinamicii statistice.
Pornind de la diferite observaţii de natură experimentală, Ludwig Boltzmann a propus ca
formulă de calcul a entropiei ca grad de dezordine: S = k·lnW, unde k constanta Boltzmann şi W
numărul de moduri în care se poate rearanja energia sistemului prin rearanjarea atomilor şi a
moleculelor pe diferite stări accesibile. Din definirea entropiei pe baza relaţiei (6.3) rezultă şi
unitatea de măsură a ei: <S>SI = JK-1.
Relaţia dintre variaţiile de entropie în mediu şi entalpia de reacţie joacă un rol esenţial în
determinarea sensului transformărilor chimice spontane.
Un sistem în contact termic şi mecanic cu mediul său, dStot = dS + dS'. Evoluţia tuturor
proceselor în sistemul izolat format din sistemul observat şi mediul înconjurător este înspre
creşterea dezordinii: dStot ≥ 0; egalitatea dStot = 0 (păstrarea dezordinii totale constante) se petrece
pentru procesele reversibile (S - funcţie de stare) aşa încât: dS ≥ -dS', aşa încât: dS≥dq/T -
inegalitatea lui Clausius.
Se introduc alte două funcţii termodinamice de energie, numite potenţiale termodinamice:
÷ Energie liberă Helmholtz: A = U - TS;
÷ Entalpie liberă Gibbs: G = H - TS.
Din formula sa de definiţie dS = dqrev/T nu rezultă că entropia S este o funcţie de stare.
Pentru a demonstra acest fapt, trebuie să demonstrăm că:
∫γ ][
rev
Tdq = 0
Fie un ciclu Carnot. Căldura cedată (qc) şi absorbită (qa) se exprimă prin:
qc = C
DC V
VlnnRT ⋅ ; qa = A
BA V
VlnnRT ⋅
Variaţia de entropie pe traseul [ABCDA] este:
∫]ABCDA[
rev
Tdq = ∫
]AB[
rev
Tdq + ∫
]BC[
rev
Tdq + ∫
]CD[
rev
Tdq + ∫
]DA[
rev
Tdq =
A
a
T|q| -
C
c
T|q| = 0
În cazul general al unui proces reversibil, acesta poate fi descompus într-o serie de cicluri
Carnot, astfel:
∫γ ][
rev
Tdq = ∑ ∫
γ γi i ][
rev
Tdq = ∑
γ i
0 = 0
Variaţia entropiei cu temperatura este dată de:
ΔSAB = ∫]AB[
rev
Tdq
şi exprimă faptul că valoarea variaţiei entropiei într-un proces oarecare între stările A şi B se
regăseşte efectuând o transformare reversibilă între A şi B şi măsurând căldura necesară.
Se combină principiul I cu al II-lea, pentru a se obţine pentru o transformare reversibilă
următoarea relaţie:
dU = dqrev + dwrev; dwrev = -pdV; dqrev = TdS; dU = TdS - pdV
O observaţie foarte importantă este că valoarea dU este independentă de drum, deci
independentă de faptul că transformarea este reversibilă sau nu, aşa încât este adevărată pentru orice
tip de transformare. Această ecuaţie se numeşte ecuaţia fundamentală a termodinamicii.
Alegem acum alte două variabile de stare independente care să caracterizeze starea unui
sistem, S şi V. Exprimăm funcţia de stare U în raport cu acestea: U = U(S,V). În mod analog se
obţine:
dU = VS
U⎟⎠⎞
⎜⎝⎛∂∂ dS +
SVU⎟⎠⎞
⎜⎝⎛∂∂ dV
Prin simpla identificare de coeficienţi în ecuaţiile diferenţiale rezultă că la compoziţie
constantă (n = const.) avem:
VSU⎟⎠⎞
⎜⎝⎛∂∂ = T,
SVU⎟⎠⎞
⎜⎝⎛∂∂ = - p
Deoarece U este funcţie de stare, rezultă relaţiile lui Maxwell:
SVT⎟⎠⎞
⎜⎝⎛∂∂ = -
VSp⎟⎠⎞
⎜⎝⎛∂∂ ;
SpT⎟⎟⎠
⎞⎜⎜⎝
⎛∂∂ =
pSV⎟⎠⎞
⎜⎝⎛∂∂ ;
VTp⎟⎠⎞
⎜⎝⎛∂∂ =
TVS⎟⎠⎞
⎜⎝⎛∂∂ ;
pTV⎟⎠⎞
⎜⎝⎛∂∂ = -
TpS⎟⎟⎠
⎞⎜⎜⎝
⎛∂∂
La T = 0 toată mişcarea termică este îngheţată şi într-un cristal perfect toate particulele sunt
dispuse într-o aranjare uniformă, regulată. Absenţa dezordinii spaţiale şi mişcării termice face ca S
= 0. Acest fapt este în acord cu formula Boltzmann, întrucât dacă W = 1 atunci
S = 0. Chiar dacă S ≠ 0 la T = 0, pentru o fază F a unei substanţe entropia sa SF(T) tinde la valoarea
sa minimă, SF(0). Acest fapt se poate exprima prin teorema calorică a lui Nernst:
Nernst: ΔS → 0 când T → 0
Formula Boltzmann şi teorema Nernst (7.26) pun bazele pentru formularea Principiului III:
Dacă entropia S a fiecărui element în starea sa cea mai stabilă la T = 0 se ia 0, atunci orice
substanţă are S ≥ 0 şi S = 0 pentru substanţele perfect cristaline (inclusiv compuşii).
O serie de programe soft au fost dezvoltate pentru modelarea structurii moleculare bazată pe
calcule de mecanică cuantică şi semiempirice, unele fiind în platformă open-source, altele free-to-
use, şi altele fiind comerciale:
÷ AMPAC (commercial);
÷ Cerius2 (commercial);
÷ Chem3D (commercial);
÷ Corina (commercial);
÷ deMon2k (free-to-use);
÷ GAMESS (open-source);
÷ GAUSSIAN (commercial);
÷ HyperChem (commercial);
÷ Insight II (commercial);
÷ Jaguar (commercial);
÷ MOE (commercial);
÷ MOLDEN (open-source);
÷ Molecular Modeling Pro (commercial);
÷ MOPAC (free-to-use);
÷ MPQC (open-source);
÷ NWChem (open-source);
÷ Octopus (open-source);
÷ PCModel (commercial);
÷ SCHRÖDINGER (commercial);
÷ Spartan (commercial);
÷ StoBe (commercial);
÷ Sybyl (commercial).
Chimie Medicală
Primele evidenţe de chimie medicală se găsesc în lucrarea lui Richet din 1893 [C R Seances
Soc Biol Fil 45:775-776]: care formulează prima relaţie lipofilicitate -activitate şi care observă
cantitativ că "plus ils sont solubles, moins ils sont toxiques";
Hansch printr-o serie de lucrări în perioada 1962-1964 pune bazele QSAR, aducând 3
contribuţii esenţiale pentru domeniu:
÷ combinarea mai multor parametrii fizico-chimici într-o singură ecuaţie de regresie;
÷ definirea parametrului de lipofilicitate π;
÷ Formularea modelului parabolic pentru relaţia neliniară între lipofilicitate şi activitatea
biologică;
Căile biosintetice pot fi controlate cu ajutorul inhibiţiei de reacţie inversă, ceea ce înseamnă
că produsul final al întregului lanţ metabolic inhibă activitatea primei enzime din lanţ (nu din genă).
Dacă prima reacţie nu mai are loc, enzimele următoare sunt "înfometate" de substrat, şi produsul
final nu mai este sintetizat. Produsul final se aşează pe prima enzimă într-o cavitate diferită de
cavitatea activă. Această a doua regiune se numeşte cavitate alosterică. Aşezarea efectorului
alosteric schimbă structura tridimensională a proteinei şi în special conformaţia cavităţii active.
Astfel, substratul nu se mai poate aşeza în cavitatea activă şi reacţia enzimatică este inhibată până
când inhibitorul de reacţie inversă nu părăseşte cavitatea alosterică.
Enzima
Cavitateaalosterică
Cavitatea activă
Legarea substratului
Are loc reacţia enzimatică
Substrat Efector alosteric
Datorită schimbării
conformaţionale a cavităţii active
reacţia enzimatică este inhibată
Nu se poate lega substratul
Absenţa reacţiei
enzimatice
Reacţia enzimatică
Metabolismul zaharurilor în organism este extrem de esenţial pentru viaţă. În figura
următoare este redat metabolismul glucozei:
anabolism
catabolism
glucogeneză
glicoliză
Dizaharide
Riboză-5-fosfat + NADPH + H+
Amidon (plante)
Glicogen (animale) Glucoză Piruvat Acetil-CoA
aerobic
Lactat
anaerobic, în muşchi
Etanol
anaerobic, în drojdie
ATP + NADH + H+ calea fosfogluconatului
Măsurarea proprietăţilor bilogice determină modalitatea de prelucrare şi interpretare a
datelor obţinute. Operaţia de măsurare se poate efectua doar cu ajutorul unei scări de măsură. Din
acest ultim unghi de vedere a problematicii măsurătorii rezultă că măsurătoarea este direct asociată
cu tipul scării de măsură. Aşa cum rezultă din ce expuse mai sus, cât de exactă este o măsurătoare
este la fel de important ca valoarea măsurătorii înseşi. Din acest motiv atunci când se exprimă
valoarea unei măsurători aceasta este însoţită de precizie, în diferite forme de exprimare ale
acesteia. Măsura referă o mărime supusă observaţiei. Din acest punct de vedere, mărimile se
clasifică în mărimi calitative şi mărimi cantitative.
O mărime este calitativă dacă pentru aceasta nu poate fi (sau cel puţin nu există) definită o
scară de valori cel puţin ordonată. Dacă scara de valori a unei mărimi admite o relaţie de ordine
(strictă) între elementele acesteia atunci mărimea este cantitativă.
Un exemplu. Să considerăm o mulţime cu 2 elemente în care ordinea elementelor nu este
relevantă: C = {a,b}. Mulţimea submulţimilor acestei mulţimi este SC = {{},{a},{b},{a,b}}. O
relaţie de ordine în mulţimea SC este definită prin numărul de elemente (cardinalitatea) al
submulţimii. Încă de la început să remarcăm că relaţia de ordine cardinalitate nu este o relaţie de
ordine strictă, existând două submulţimi cu acelaşi număr de elemente: |{a}| = |{b}| = 1. Relaţie de
ordine strictă există între 0 = |{}| < |{a}| = 1 = |{b}| < |{a,b}| = 2.
O întrebare se ridică acum: "Ce fel de scală de măsură defineşte cardinalitatea?" şi pentru a
afla răspunsul trebuie să ne întoarcem la observaţie şi anume să ne punem întrebarea "Ce
caracteristică se doreşte a fi evaluată?". Dacă răspunsul la această a doua întrebare este numărul de
elemente al submulţimii observate, atunci într-adevăr mărimea măsurată este cantitativă, având
submulţimea cu 0 elemente care este evident mai mică decât submulţimile cu 1 element şi care sunt
evident mai mici decât submulţimea cu 2 elemente. Dacă se doreşte diferenţierea submulţimilor
mulţimii C, atunci cu siguranţă că măsura cardinalitate nu este corect aleasă. Putem să ne
concentrăm atenţia (observăm) însă numai mulţimile cu exact 1 element, pentru care măsura
cardinalitate nu diferenţiază: {a} şi {b}. În acest caz ne aflăm într-o situaţie tipică de măsură
calitativă, exprimată prin "Submulţimea conţine elementul 'a'?", întrebare al cărui răspuns în
exemplul de mai sus este complementar cu răspunsul la întrebarea "Submulţimea conţine elementul
'b'?".
Exemplul de mai sus a arătat cel puţin că procedura de definire a unei scale de măsură
trebuie cel puţin verificată din punct de vedere al consistenţei, sau, dacă scala este deja definită
(cum a fost cazul cardinalităţii), se impune cel puţin verificarea consistenţei acesteia în raport cu
mărimea observată şi scopul urmărit. Mai mult, tot din exemplul de mai sus rezultă că chiar în
absenţa unei relaţii de ordine între valorile măsurate ({a} şi {b}) pot exista însă alte tipuri de relaţii
între valorile măsurate (în cazul de mai sus, este complementul logic, {a} = {a,b}\{b}; {b} =
{a,b}\{a}), ceea ce face ca valorile unei mărimi calitative să nu fie independente.
O scală de măsură este nominală dacă între valorile acesteia nu se poate defini o relaţie de
ordine. De aici rezultă că în mod uzual scala de măsură nominală este caracteristică mărimilor
calitative.
În cadrul scalelor de măsură nominale, un caz extrem de importantă este scala (de măsură)
binomială formată din doar două valori (între care nu există relaţie de ordine) cum ar fi: {Da, Nu},
{Viu, Mort}, {Vivo, Vitro}, {Prezent, Absent}, {Alcan saturat, Alt tip de compus}, {Număr întreg,
Număr neîntreg}.
O caracteristică extrem de importantă a scalelor nominale este că ele au un număr finit de
elemente (valori) şi aşa cum am observat şi în cazul mărimilor calitative indiferent de numărul
acestora, între ele există o legătură de complementaritate. Astfel, pentru o scală de măsură nominală
formată din grupele sangvine {0, A, B, AB} o valoare care este diferită de oricare 3 din cele 4
valori este cu siguranţă a 4-a dintre acestea. Scala de măsură nominală care nu este binomială se
mai numeşte şi scală de măsură multinomială.
O serie finită de valori poate să constituie o scală ordinală dacă elementele acesteia se află
într-o relaţie de ordine. Astfel, de exemplu valorile {Prezent, Absent} enumerate între exemplele de
scală binomială pot deveni scală ordinală dacă între valorile "Prezent" şi "Absent" se defineşte o
relaţie de ordine ("Absent" < "Prezent"). Alte astfel de exemple sunt "Fals" < "Adevărat", 0 < 1,
"Negativ" < "Nenegativ", "Nepozitiv" < "Pozitiv". Dintre exemplele de scale de măsură cu 3 valori
unul este imediat: "Negativ" < "Zero" < "Pozitiv".
Ceea ce deosebeşte suplimentar o scală ordinală de o scală nominală este faptul că nu este
necesar ca scala ordinală să fie formată dintr-un număr finit (sau cunoscut) de elemente. Este
necesar însă ca intre ele să existe o relaţie de ordine definită cel puţin printr-o funcţie "Succesor" al
unei valori şi complementul acesteia "Predecesor".
În scala interval distanţa între atribute are o semnificaţie. De exemplu la măsurarea
temperaturii, distanţa între 30° şi 40° este aceeaşi cu distanţa între 70° şi 80°. Intervalul între valori
este interpretabil (are o semnificaţie fizică). Acesta este motivul pentru care are sens să calculăm
media unei variabile de tip interval, ceea ce nu se aplică la scalele ordinale. Aşa cum 80° nu
reprezintă de două ori mai cald decât 40°, pe scalele interval nu are sens raportul a două valori.
În final, pe scala raport există totdeauna valoarea 0 care are semnificaţie. În mod evident
construcţia unei scale raport presupune că cea mai mică valoare care se poate observa este 0.
Aceasta înseamnă că întotdeauna se poate evalua raportul a două măsuri pe o scală raport, aceasta
fiind de asemenea o scală raport.
Este important de notat că calitatea unei scale de măsură nu dă şi acurateţea de măsură, sau
densitatea valorilor posibile ale unei variabile în jurul valorii măsurate. Astfel, chiar dacă frecvent
folosim ipoteza că o variabilă este continuă (între oricare două valori măsurate teoretic există cel
puţin încă o valoare) în practică se întâmplă deseori ca valoarea intermediară a cărei existenţă este
presupusă (sau demonstrată teoretic sau practic) să nu poată fi observată (măsurată) datorită
preciziei de care dispunem în măsură. Este de notat deci că tipul scalei de măsură nu dă şi caracterul
variabilei măsurate. Se pot la fel de bine măsura variabile discrete pe scale de măsură raport cum se
pot măsura şi variabilele continue.
Astfel, din punct de vedere al tipului scalei de măsură, o variabilă care numără moleculele
dintr-un set de date este "la fel de" variabilă raport ca o variabilă care măsoară temperatura la care
aceste molecule se află în mediul ambiant sau trec de la starea de agregare solidă la cea lichidă.
În tabelul 16 este redată o scară de măsură relativă (cu o singură referinţă), în care se
exprimă cantitatea de dulce a zaharurilor.
Tabelul 16. Cât de dulci sunt zaharurile Zahar Dulceaţă relativă la sucrozălactoză 0.16
galactoză 0.32 maltoză 0.33 sucroză 1.00 fructoză 1.73 aspartam 180 zaharină 450
În figura de mai jos este reprezentată entropia scalelor de măsură în termeni de organizare a
informaţiei.
Binare Nominale
Ordinale Interval
Raport
Figura exprimă o serie de proprietăţi ale scalelor de măsură. Astfel, mulţimea scalelor de
măsură binomiale este cea mai largă, cuprinzând scalele nominale. Demonstraţia acestui fapt este
uşor de făcut. Admiţând că avem la dispoziţie o scală nominală cu 3 categorii, atunci se pot defini
pe baza acesteia 3 scale binomiale, fiecare verificând apartenenţa măsurabilei la una din cele 3
categorii. Mulţimea scalelor ordinale este inclusă în mulţimea scalelor nominale. Admiţând că avem
la dispoziţie o scală ordinală, renunţând la relaţia de ordine deja am construit scala de măsură
nominală asociată. În mod identic, având la dispoziţie o scală interval, o putem segmenta pe aceasta
într-un număr arbitrar de subintervale şi cu ajutorul acestor subintervale construim una din scalele
ordinale asociate scalei interval.
O proprietate importantă rezultă din incluziunea scalelor de măsură, şi anume incluziunea
instrumentelor statistice (testelor statistice) cu pe care le avem la dispoziţie să caracterizăm sau
investigăm mărimile măsurate. Presupunând că am înregistrat valorile variabilei X cu o scală de
măsură atunci toate statisticile care se pot aplica variabilei X în ipoteza că a fost măsurată cu o scală
de măsură care o conţine pe cea utilizată, se aplică în egală măsură şi observaţiei cu scala de măsură
utilizată, care, desigur, oferă în plus o serie de statistici care nu se aplică decât acestei scale şi celor
pe care le include.
La fiecare nivel de incluziune, nivelul curent include deci toate calităţile ale mulţimilor mai
mari şi aduce ceva în plus, reducând entropia scalei de măsură. În mod evident, totdeauna este de
dorit ca în observarea unei variabile să se folosească acea scală de măsură care înglobează cele mai
multe caracteristici pe care variabila observată le prezintă, cum tot atât de important (sau mai
important) este ca anumite atribute pe care le produce scala să fie proprii variabile şi să nu fie create
în mod artificial de măsură, în caz contrar scala de măsură devenind o sursă de eroare.
O serie de baze de date cumulează evidenţe de chimie medicală. Grupate pe categorii,
acestea sunt:
÷ Conţinând date de efect biologic:
÷ AmicBase;
÷ Biocatalysis/Biodegradation DB;
÷ Carcinogenic Potency Project;
÷ ChemBank;
÷ Drug Data Report DB;
÷ EDKB;
÷ FDA Toxicity DBs;
÷ ISS Chemical Carcinogens;
÷ Leadscope Toxicity DB;
÷ NIH NIEHS National Toxicology Program;
÷ NIH NCI DBs (CambridgeSoft, CCC, MDL, DayLight);
÷ Prous Science DBs;
÷ PubChem;
÷ RTECS (MDL, NIOSH);
÷ US EPA DSSTox;
÷ Vitic;
÷ Conţinând biopolimeri:
÷ ASEdb;
÷ 3DID;
÷ BID;
÷ BOND;
÷ BRITE;
÷ DIP;
÷ EMPIRE;
÷ GRID;
÷ iHOP;
÷ IntAct;
÷ InterDom;
÷ KDBI;
÷ MiMI;
÷ MINT;
÷ MPPI;
÷ NuRISITE;
÷ Orientation of Proteins in Membranes;
÷ POINT;
÷ ProtCom;
÷ SNAPPI-DB;
÷ SPIN-PP;
÷ STRING;
÷ UniHI;
÷ Domain Motions;
÷ molmovdb;
÷ ProMode;
÷ PCDDB;
÷ PPD;
÷ Conţinând compuşi chimici şi medicamente:
÷ Available Chemicals Directory (DayLight);
÷ Cambridge Structural DB;
÷ CCCBDB;
÷ CenterWatch;
÷ Drug Directories;
÷ ChemDB;
÷ ChemExper;
÷ ChemFinder;
÷ ChemIDPlus;
÷ chEBI;
÷ ChEMnetBASE;
÷ ClogP of Selected Drugs;
÷ Comprehensive Medicinal Chemistry DB;
÷ CSLS;
÷ Cyberlipid Center;
÷ DrugBank;
÷ Drug Data Report;
÷ Data & Property Calculation Websites;
÷ EPA Chemical Registry System;
÷ ESIS;
÷ FDA Databases;
÷ FDA Toxicity Databases / Leadscope;
÷ FooDBank;
÷ Handbook of Chemistry and Physics;
÷ Henry's Law Constants;
÷ Investigational Drugs DB;
÷ iResearch;
÷ Landolt-Börnstein;
÷ LDB;
÷ Leadscope Known Drugs;
÷ Ligand.Info;
÷ LiqCryst;
÷ LogKow;
÷ MDPI;
÷ MedChem;
÷ Merck Index;
÷ Metabolite DB;
÷ NIST Online DBs (Gateway);
÷ NLM SIS;
÷ NCI DIS 3D DB;
÷ Organic Compounds DB;
÷ PhRMA New Medicines DB;
÷ PhysProp DB;
÷ Screening Compounds Directory;
÷ SickList;
÷ Solubility DB (IUPAC-NIST);
÷ SRC Pointer File;
÷ Stability Constants DB (IUPAC);
÷ Super Drug Database;
÷ World Drug Index (DayLight);
÷ ZINC;
÷ Conţinând date de mediu:
÷ ATSDR HazDat Database;
÷ Environmental Fate DB;
÷ Environmental Fate of Chemicals;
÷ US EPA's IRIS;
÷ Pesticide DB;
÷ U.S. EPA TSCA (Cornell, DayLight, SRC);
÷ Conţinând afinităţi de legătură:
÷ AffinDB;
÷ BindingDB;
÷ Binding MOAD;
÷ ChemBank;
÷ DLRP;
÷ KiBank;
÷ PDBbind;
÷ PDSP Drug Ki DB;
÷ PubChem;
÷ SCORPIO (structure-calorimetry);
÷ SMID;
÷ WOMBAT;
÷ eF-site;
÷ LigBase;
÷ MSDsite;
÷ PDBSite;
÷ PINTS;
÷ PRECISE;
÷ pvSOAR;
÷ Relibase;
÷ sc-PDB;
÷ SitesBase;
÷ SMIDSuite;
÷ SuMo;
÷ Super Ligands;
÷ Conţinând structuri şi proprietăţi ligand-receptor:
÷ BioMagResBank;
÷ CAZy;
÷ FireDB;
÷ IceDB;
÷ IMB;
÷ LPC/CSU;
÷ Luna;
÷ Macromolecular Structures DB (till 1999);
÷ mmdb;
÷ MSD;
÷ NDB;
÷ NIH CMM Links;
÷ nrpdb;
÷ OCA;
÷ PDB;
÷ PDBj;
÷ PDBSelect;
÷ PDBsum;
÷ Planet;
÷ PRECISE;
÷ PROCAT;
÷ RCSB DBs;
÷ RECOORD;
÷ SCOP;
÷ Side-Chain Interactions;
÷ SPIN-PP;
÷ STING Millenium Suite;
÷ wwPDB;
÷ XPDB;
÷ Conţinând date de QSAR şi toxicogenomică:
Analiza rezultatelor obţinute şi interpretarea rezultatelor
Grassy şi alţii în 1998 în lucrarea [Computer Assisted Rational Design of
Immunosuppressive Compounds, Nature Biotechnol 16:748-752] raportează căutarea de pepdide
posedând activitate imunosupresivă. Aceştia au utilizat 27 descriptori de proprietate (12 descriptori
de chimie matematică şi 15 descriptori de chimie cuantică). S-a generat o librărie combinatorială cu
280000 de compuşi după care s-au selectat 26 de peptide pentru care o înaltă activitate a fost prezisă
cu ajutorul descriptorilor. 5 dintre aceste peptide au fost sintetizate şi testate experimental. Cea mai
potentă dintre acestea a arătat o activitate imunosupresivă de aproximativ 100 de ori mai mare decât
compusul de referinţă.
Problema integrării informaţiilor de natură cuantică (geometria moleculară) cu cele de
natură matematică (topologia moleculară) în prezicerea activităţilor biologice (chimia medicală)
este o problemă dificilă şi analiza şi interpretarea rezultatelor necesită implementarea de algoritmi
meta-euristici.
Lamarck (Lamarck, 1809) după eforturi extraordinare de clasificare a organismelor vii,
remarcă că atât în ceea ce priveşte animalele (studiind mai cu seamă animalele nevertebrate) cât şi
plantele clasificarea pe specii şi varietăţi este mai mult sau mai puţin arbitrară, aducând numeroase
argumente în acest sens. Făcând apel la taxonomia modernă, astăzi sunt recunoscute 5 domenii, care
mai apoi se subîmpart pe divizii, clase, ordine, familii, genuri şi specii. Însă studiile lui Lamarck
despre specii rămân de o deosebită importanţă, în ciuda faptului că explicaţia pe care a găsit-o
Lamarck asupra observaţiilor sale bazată pe superstiţiile vremii şi anume că golurile constatate în
schema de clasificare a speciilor ar fi în fapt datorată dispariţiei acestora a fost contrazisă ulterior de
studiile lui Darwin (Darwin, 1859). Chiar şi Darwin a fost influenţat de concluziile la care a ajuns
Lamarck, aşa cum nota Fisher în 1954 (Fisher, 1954). Realizările majore ale epocii de început a
geneticii sunt completate de studiile de încrucişare de varietăţi ale lui Mendel (Mendel, 1866)
stabileşte legile care astăzi îi poartă numele, formularea teoriei moştenirii dure care vine să
completeze elementele lipsă lăsate de predecesori (Weismann, 1893), şi în final studiile pe
musculiţa de oţet ale lui Morgan (Morgan, 1915) în urma cărora acesta elaborează teoria
cromozomială a moştenirii, care este şi astăzi la baza geneticii moderne. Nu în ultimul rând se
menţionează studiile de o deosebită valoare ştiinţifică ale lui Fisher (Fisher, 1918; Fisher, 1922),
care a adus argumente ştiinţifice de necontestat (chiar dacă la vremea când acestea au fost scrise de
către Fisher au fost din plin contestate, aşa cum se poate desprinde şi din fragmentele alese pentru
exemplificare) cu privire la originea speciilor şi teoria evoluţionistă.
Rezumând, moştenirea dură (Weismann, 1893) şi uşoară (Lamarck, 1809), selecţia şi
supravieţuirea (Darwin, 1859), genele şi încrucişarea genelor (Morgan, 1915) şi caracterelor
(Mendel, 1866) îndelung dezbătute şi disputate de-a lungul secolului 19 (Fisher, 1954) constituie
toate piese dintr-un puzzle care construieşte astăzi genetica modernă (Ayala şi alţii, 1994), şi
reprezintă sursele de inspiraţie ale algoritmilor genetici.
Primele simulări ale evoluţiei se regăsesc în studiile lui Nils Aall BARRICELLI (Barricelli,
1954). Puţin timp mai târziu, Alex FRASER (1923-2002) a publicat o serie de lucrări despre
simularea selecţiei artificiale a organismelor cu locuşi multipli ce controlează o trăsătură
măsurabilă. Simulările lui Fraser (Fraser, 1957-1970) includ toate elementele esenţiale ale
algoritmilor genetici moderni.
Uzual, în viaţa noastă de zi cu zi la fel ca şi în cercetarea ştiinţifică noi operăm cu probleme.
În informatică şi ramurile derivate ale acesteia (cum e cazul bio-informaticii şi chemo-informaticii)
o problemă are o semnificaţie precisă, foarte apropiată cu cea de algoritm. Un algoritm este în
esenţă o reţetă specificând ce să facem în anumite condiţii pentru a obţine un anumit obiectiv. Un
algoritm necesită două resurse pentru a rezolva o problemă, şi anume timp (cu sensul de timp de
execuţie, mărime corelată cu numărul de instrucţiuni elementare) şi spaţiu (pentru stocarea datelor
de intrare şi a variabilelor).
Nu toate problemele sunt de aceeaşi complexitate şi acelaşi lucru este valabil şi pentru
algoritmii de rezolvare. Astfel, unele probleme au complexitate exponenţială, ceea ce înseamnă că
cel mai bun algoritm rezolvă problema într-un timp de execuţie ce creşte exponenţial în funcţie de
dimensiunea (volumul, mărimea) datelor de intrare. Acest tip de probleme sunt numite dificile,
deoarece chiar şi cel mai bun algoritm (care există sau ar putea exista) va fi probabil nepractic cu
date de intrare din practică (Falkenauer, 1998).
Dacă o problemă este dificilă, atunci căutarea optimului frecvent iese în afara timpului
disponibil pentru aplicaţiile reale. Chiar dacă există această problemă, există totuşi o serie de
probleme întâlnite în practică când obţinerea optimului nu este necesară (obligatorie). De cele mai
multe ori o soluţie bună este suficientă.
În concluzie, căutarea pentru algoritmi de aproximare buni este perfect legitimată, chiar dacă aceşti
algoritmi nu garantează atingerea optimului global pentru orice instanţă cu care sunt hrăniţi, dar
care produc soluţii aproape de soluţia optimă.
Deoarece cele mai multe probleme dificile au fost împrejurul nostru de foarte mulţi ani,
pentru o varietate de probleme dificile unul sau mai mulţi euristici au fost deja concepuţi. Aceştia
sunt seturi de reguli gândite pentru a rezolva o problemă anume, uzual bazaţi pe bunul simţ (în ceea
ce priveşte soluţia aşteptată) prin evitarea erorilor grosolane, dar care nu sunt gândiţi pentru a
produce totdeauna soluţia cu exactitate şi respectiv să fie capabili să producă o soluţie pentru orice
valori de intrare.
Chiar dacă cei mai mulţi euristici sunt foarte mult ad-hoc şi dependenţi de problema dată,
odată cu dezvoltarea informaticii cercetătorii au reuşit să formuleze trei euristici care sunt foarte
generali, şi anume aplicabili la o mare varietate de probleme dificile. Din cauza acestei generalităţi
pe care o posedă, aceştia au căpătat numele de meta-euristici. Toţi trei sunt stocastici [a fi stocastic:
Implicând sau conţinând una sau mai multe variabile aleatoare, implicând şansa sau probabilitatea] în natura
lor, doi dintre aceştia (SA şi GA) fiind bazaţi pe procese naturale care au loc în jurul nostru din
totdeauna. Împreună cu călirea simulată (în engleză SA - Simulated Annealing; van Laarhoven and
Aarts, 1987; Davis, 1987) şi căutarea tabu (în engleză TS - Tabu Search; Glower, 1977 şi 1986;
Glover şi alţii, 1992) sunt şi algoritmii genetici (în engleză GA - Genetic Algorithm).
Primele studii în care au apărut algoritmii genetici se găsesc în anul 1954, însă studii de
amploare ale acestora au apărut după 1970 (Bosworth şi alţii, 1972; Holland, 1975) şi au fost re-
inventaţi ceva mai târziu (Davis, 1991, Holland, 1992).
Înainte de a defini ceea ce este un algoritm genetic, să definim mai întâi prin ce evaluează
calitatea unul algoritm euristic. Sunt trei criterii care trebuie considerate:
÷ viteza: cât de repede obţine soluţia;
÷ precizia: cât de departe de află acea soluţie de optimul global;
÷ scopul: cât de mare este subsetul datelor de intrare în raport cu setul tuturor valorilor posibile
pentru care algoritmul performează în raport cu anterioarele două criterii;
O problemă importantă legată de complexitatea algoritmică este reprezentată de teorema
inexistenţei mesei pe gratis (în engleză NFLT - No Free Lunch Theorem; Wolpert and Macready,
1995 şi 1997), teoremă care utilizând aceste trei criterii de mai sus arată că toţi algoritmii sunt strict
echivalenţi, ceea ce înseamnă că pentru doi algoritmi A şi B, pentru fiecare set de date pentru care
A performează mai bine decât B există un set de date pentru care B performează mai bine decât A.
Interpretarea simplă care se dă acestei teoreme în termeni comuni şi anume că oricât ai încerca să-ţi
faci algoritmii tăi mai isteţi, este un efort în van deoarece ei vor performa la fel ca orice alt algoritm,
nu este una corectă. Ceea ce teorema într-adevăr spune este că dacă se mediază performanţele
tuturor algoritmilor pe toate datele posibile, atunci ei vor performa la fel. Revenind la termeni
comuni, şmecheria este desigur să nu încerci să hrăneşti toţi algoritmii pe care îi realizezi pe toate
datele cu putinţă, ci să încerci să îţi dedici algoritmul la un domeniu de aplicabilitate, şi aici să iei
în considerare şi să valorifici prin implementare în algoritm orice structură specială este posibil să
existe în datele cu care intenţionezi să hrăneşti algoritmul. De aici rezultă că scopul algoritmului
care performează bine trebuie să fie restrâns la setul de date care prezintă structurile speciale
identificate.
Următoarele categorii de probleme pot fi subiect de rezolvare pentru algoritmii genetici:
÷ Probleme de decizie
o O problemă de decizie este definită pentr-o întrebare cu răspuns de tipul da/nu pe un
set (infinit) de date de intrare; din acest motiv problemele de decizie sunt echivalente
cu obţinerea setului de date de intrare pentru care răspunsul problemei este da.
Problemele de decizie sunt legată de problemele de optimizare atâta timp cât
problema este obţinerea celui mai bun răspuns la problemă.
÷ Probleme de clasificare
o O problemă de clasificare pentru obiecte dintr-un domeniu dat
este în separarea acestor obiecte în clase mai mici, şi producerea
de criterii de determinare dacă un obiect anume dintr-un
domeniu este într-o anume clasă sau nu. Una dintre cele mai
faimoase probleme de clasificare este problema formulată de
Carl LINNAEUS (23 Mai 23 1707 - 10 Januarie 10 1778) a
clasificării vieţuitoarelor după clase, ordine, genuri şi specii
(Linnaei, 1735).
÷ Probleme de optimizare
o O problemă de optimizare este o problemă de găsire a celei mai bune soluţii dintre
toate soluţiile posibile. În mod formal, o problemă de optimizare este un cvadruplu
(I,f,m,g) unde:
I - set de instanţe;
f(·) - setul soluţiilor posibile definite pe I;
m(·,·) - măsura definită pe produsul soluţiilor posibile şi instanţelor
g - min. sau max. - funcţia obiectiv
scopul este găsirea optimului lui x: m(x,f(x))=g{m(y,f(y), y ∈I}
o Pentru fiecare problemă de optimizare există o problemă de decizie care este asociată
şi a cărei întrebare este dacă există o soluţie posibilă pentru o anumită măsură m0.
÷ Probleme de simulare
o Simularea este imitarea unui fapt real, unei stări de fapt, sau a unui proces. Actul
simulării a ceva în general implică reprezentarea unor anumite caracteristici sau
comportamente cheie ale unui sistemul fizic sau abstract. Simularea este folosită în
multe contexte incluzând modelarea sistemelor naturale, pentru a pătrunde
funcţionalitatea acestora. Elementele cheie în simulare includ achiziţia unei surse
valide de informaţie despre subiectul de studiu, selecţia caracteristicilor şi
comportamentelor cheie, utilizarea de aproximaţii şi presupuneri simplificatoare în
cadrul simulării, şi evaluarea fidelităţii şi validităţii rezultatelor simulării.
Algoritmii genetici sunt algoritmi de căutare euristici adaptivi bazaţi pe ideile teoriei
evoluţiei şi anume aduce conceptele de selecţie naturală şi genetică în arena simulării matematice cu
ajutorul calculatorului. Mimica proceselor observate în evoluţia naturală a materiei organice în
general serveşte drept instrument algoritmilor genetici în scopul de a rezolva probleme de decizie,
clasificare, optimizare şi simulare. Elementele cheie la care se face apel în algoritmii genetici sunt:
÷ Modelul genetic (dualismul genotip - fenotip) aşa cum a fost el formulat şi argumentat încă de la
primii paşi ai geneticii (Morgan, 1915; Fisher, 1918);
÷ Încrucişarea (dualismul caractere - gene) aşa cum a fost ea observată încă de la precursorii
geneticii moderne (Lamarck, 1830; Mendel, 1865; Weismann, 1893);
÷ Mutaţia, aşa cum a fost ea observată încă de la precursorii geneticii moderne şi până în zilele
noastre:
o întâmplătoare (De Veies, 1902);
o deliberată prin expunerea la anumite condiţii (Patterson, 1928; Auerbach şi alţii, 1947);
o sub presiunea factorilor de mediu: (Cains şi alţii, 1988);
÷ Selecţia naturală sau "supravieţuirea celui mai tare" (Darwin, 1859).
Construcţia algoritmilor genetici.
Algoritmii genetici se materializează sub forma de programe evolutive şi sunt simulări pe
calculator în care:
(spaţiul de căutare)
÷ Se operează asupra unei populaţii de reprezentări abstracte numite (după elementele genetice pe
baza cărora au fost imaginate) cromozomi sau genotipuri ale unui genom, la rândul său fiecare
reprezentare abstractă a unui cromozom fiind compusă din gene.
··· ··· ··· ···
genă cromozom genom
Spaţiul de căutare al unui algoritm genetic
÷ Fiecare generaţie este compusă dintr-o populaţie de şiruri de caractere (sau alte forme de
reprezentare abstractă) analog cu cromozomii ADN-ului. Fiecare element al populaţiei
reprezintă un punct în spaţiul de căutare şi în acelaşi timp o soluţie posibilă.
÷ Ceea ce Figura 1 reprezintă formal, şi anume spaţiul de căutare al unui algoritm genetic, poate
avea multe variante de implementare, trei dintre ele fiind următoarele:
o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile formulate în
sistemul S (în engleză: S-system formalism, Savageau, 1976) care este un tip de formalism
derivat din modelul de proces al reacţiilor stoechiometrice cu pre-echilibru (ΣiRi ↔ ΣjIj →
ΣkPk, unde Ri reactanţi, Ij intermediari, Pk produşi ai unei reacţii în care constantele de
proces - constantă de viteză şi ordine parţiale de reacţie - sunt necunoscute şi se doresc a fi
determinate), atunci următoarea este o posibilă implementare:
O genă: o constantă (un ordin parţial sau o constantă de viteză de reacţie) subiect al
găsirii (optimizării);
Un cromozom: o posibilă cale de desfăşurare a reacţiei, având specificate toate ordinele
parţiale şi constantele de viteză specificate;
Genomul: toate căile de desfăşurarea a reacţiei prezente într-o iteraţie a algoritmului
genetic;
o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile de aliniament de
secvenţe genetice (Notredame şi Higgins, 1996) de ADN, ARN sau proteine în scopul
identificării regiunilor de similaritate care pot fi sursă de relaţii structurale, funcţionale sau
evolutive între secvenţe, atunci următoarea este o implementare posibilă:
O genă: două (sau mai multe) poziţii corespunzătoare la două (sau mai multe) sub-
secvenţe aliniate (sau mai exact pseudo-aliniate) şi lungimea aliniamentului acestora;
Un cromozom: o posibilitate de aliniament pentru cele două (sau mai multe) secvenţe;
Genomul: toate posibilităţile de aliniament de secvenţe stocate într-o iteraţie a
algoritmului genetic;
o Dacă algoritmul genetic are ca scop o problemă de setare în managementul efectuat în
scopul maximizării randamentului de producţie în câmp (Liu şi alţii, 2001), o problemă
dificilă de setare a parametrilor controlabili (sau alteori predictibili) pentru obţinerea unei
productivităţi maxime, atunci următoarea este o implementare posibilă:
O genă: una dintre următoarele: pH-ul solului, fertilizatori în termeni de cantitate de N,
P şi K, cantitatea de materie organică din sol, gradul de creştere termică zilnică (o
mărime medie între temperatura minimă şi maximă a zilei), potenţialul genetic (ce poate
fi exprimat în termeni de randament care s-ar obţine dacă vremea, solul şi fertilitatea
sunt toate optime), cantităţile de precipitaţii pe perioada de maximă vegetaţie pe lunile
Mai, Iunie, Iulie şi August, densitatea de plantare şi factorul de rotaţie;
Un cromozom: o stare de fapt care poate apare în practică în câmp;
Genomul: toate stările de fapt stocate într-o iteraţie a algoritmului genetic;
(selecţia şi supravieţuirea)
÷ Un scor sau şansă de supravieţuire a fiecărei soluţii este calculată pentru fiecare genotip cu
ajutorul unei funcţii, numită şi funcţie obiectiv. Valoarea acestei funcţii este asociată cu
abilitatea individului să supravieţuiască şi defineşte astfel fenotipul asociat genotipului.
ADN plantă cultivar
decodare mediu
codare
genotip fenotip supravieţuire
Selecţia: genotip, fenotip şi supravieţuire
÷ Dacă fiecare genotip reprezintă un punct în spaţiul de căutare şi în acelaşi timp o soluţie
posibilă, prin intermediul selecţiei genotipul este concretizat în fenotip (operaţie care iterează
reprezentarea soluţiilor posibile în spaţiul soluţiilor şi evaluează valoarea acestora). Principiul
selecţiei naturale se exprimă astfel:
o Indivizii (fenotipurile) din populaţie concurează pentru supravieţuire (selecţie).
o Genele indivizilor selectaţi se propagă de la o generaţie la alta (datorită selecţiei);
o Fiecare generaţie devine mai potrivită mediului în care se află (prin penalizarea indivizilor
care eşuează a supravieţui).
÷ Scorul este asociat fiecărui fenotip (soluţie) reprezentând abilitatea acestuia să concureze pentru
resurse în mediu, pentru supravieţuire (selecţie). Scopul algoritmului genetic este ca să aplice
încrucişarea şi mutaţia selectivă a fenotipurilor (prin intermediul decodării lor în genotipurile
din care provin) pentru a produce descendenţi mai buni decât părinţii lor.
÷ Algoritmul genetic menţine un cultivar (un eşantion de populaţie) de un număr dat (sau uneori
variabil) de genotipuri a căror selecţie se poate face aplicând acelaşi operator. Astfel, selecţia şi
supravieţuirea sunt două concepte asociate. Selecţie se face pentru operaţiile de încrucişare şi
mutaţie, şi selecţie se face şi pentru supravieţuire în populaţia limitată de fenotipuri.
÷ Prin selecţie o parte din indivizii populaţiei mor şi sunt înlocuiţi de alţii. În acest mod se speră
că de-a lungul generaţiilor soluţii mai bune vor răsări în timp ce cele mai slabe soluţii sunt
înlăturate. Odată cu trecerea de la o generaţie la alta populaţia va conţine din ce în ce mai bune
soluţii decât generaţia anterioară.
şir soluţie
decodare funcţie
obiectiv codare
valoare
÷ În tabelul următor (Tabelul 17) este redată legătura care se stabileşte între scorul (exprimat prin
funcţia Fitness(·) în tabel) şi regula de selecţie în funcţie de metoda (aşa cum este ea cunoscută
în literatura de specialitate) folosită.
Tabelul 17. Scor şi selecţie în algoritmii genetici
Metodă Expresia funcţiei de scor Selecţie Comentarii Proporţional pi=fi/Σifi Şansa de selecţie este proporţională cu
scorul (utilizând probabilitatea pi în selecţie)
Deterministic i | fi = max. sau min.
Selecţia indivizilor este făcută pe baza celui mai tare (sau celui mai slab) individ (elitism)
Turnir
fi=Fitness(Cromozom_i)
(fi,fj) max. sau
min.
Perechi de indivizi concurează între ei pentru selecţie (din nou cel mai tare sau cel mai slab)
Normalizare gi=(fi-N0)(fmax.-fmin.)/(N1-N0)
pi=gi/Σigi O scală fixă [N0,N1] normalizează scorul fenotipurilor între generaţii diferite
Ranguri hi=Rank(fi)(fmax.-fmin.)/Size pi=hi/Σihi Şansa este proporţională cu rangul scorului unde: Rank(·): rangul; Size: volum genom
÷ Ceea ce se reprezintă formal, şi anume selecţia şi supravieţuirea fenotipurilor poate avea multe
variante de implementare, trei dintre ele fiind următoarele:
o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile formulate în
sistemul S (Savageau, 1976), atunci următoarea este o posibilă implementare:
Şirul, corespunzător unui genotip: o listă de valori constante subiect al optimizării şi
asociat cu un experiment virtual;
Soluţia, corespunzătoare genotipului (şi cromozomului): seria de timp a elementelor
experimentului virtual (pentru o reacţie chimică prin soluţie se înţeleg seriile de timp ale
concentraţiilor reactanţilor, intermediarilor şi produşilor de reacţie pe parcursul
desfăşurării reacţiei);
Valoarea, corespunzătoare scorului: suma pătrată a diferenţelor dintre valorile observate
(ca serie sau serii de timp) şi valorile estimate (de fenotip) ale uneia (sau mai multor)
observabile (cum ar fi concentraţie sau concentraţii de intermediari);
o Dacă algoritmul genetic are ca subiect rezolvarea unei probleme dificile de aliniament de
secvenţe de aminoacizi (Notredame şi Higgins, 1996), atunci următoarea este o posibilă
implementare:
Şirul, corespunzător unui genotip: o listă de perechi (sau de mai multe) poziţii de sub-
secvenţe aliniate urmată de lungimea fiecărei sub-secvenţe;
Soluţia, corespunzătoare fenotipului (şi genotipului): o serie de valori conţinând poziţii
de rupere şi lungimi de translatare necesare pentru a alinia secvenţele;
Valoarea, corespunzătoare scorului: o funcţie de scor dând (uzual sub forma unei sume)
costul total pentru toate ruperile şi deplasările necesare pentru a alinia secvenţele,
utilizând un cost predefinit pentru o rupere şi pentru deplasarea unei unităţi în secvenţă;
o Dacă algoritmul genetic setarea parametrilor necesari pentru obţinerea unei bune producţii
în câmp (Liu şi alţii, 2001), atunci următoarea este o posibilă implementare:
Şirul, corespunzător unui genotip: o listă de valori ce corespund unui experiment virtual
şi constituie obiect al optimizării; Valorile din şir pot fi: pH-ul solului, fertilizatori în
termeni de cantitate de N, P şi K, cantitatea de materie organică din sol, gradul de
creştere termică zilnică (o mărime medie între temperatura minimă şi maximă a zilei),
potenţialul genetic (ce poate fi exprimat în termeni de randament care s-ar obţine dacă
vremea, solul şi fertilitatea sunt toate optime), cantităţile de precipitaţii pe perioada de
maximă vegetaţie pe lunile Mai, Iunie, Iulie şi August, densitatea de plantare şi factorul
de rotaţie;
Soluţia, corespunzătoare fenotipului (şi genotipului): un şir de valori caracterizând
soluţia, cuprinzând valori obţinute prin aplicarea de funcţii care să exprime: calitatea
solului, calitatea vremii, managementul de cultivare, potenţialul genetic şi efectul unor
evenimente întâmplătoare;
Valoarea, corespunzătoare scorului: suma pătratelor diferenţelor între randamente
observate (în serii de experimente anterioare) şi estimate (de fenotip) ale randamentelor;
(încrucişarea şi mutaţia)
÷ Încrucişarea reprezintă împerecherea între fenotipuri; fenotipurile (uzual două) sunt selectate
din populaţie folosind operatorul de selecţie; o porţiune de încrucişat de-a lungul şirului de gene
ale genotipurilor asociate fenotipurilor este aleasă (întâmplător sau deterministic) şi valorile
celor două porţiuni de şiruri sunt schimbate între ele, rezultând astfel din această împerechere
doi descendenţi care sunt direct selectaţi pentru a face parte din noua generaţie de populaţie;
încrucişarea este făcută în speranţa că dacă se recombină porţiuni de genotipuri de succes,
atunci acest proces este probabil să producă descendenţi chiar mai buni decât părinţii din care
provin;
O încrucişare dublă implicând ruperea şi reunirea cromozomilor părinţilor
··· ··· ···
··· ··· ···
site încrucişare
··· ··· ···
··· ··· ···
părinţi
copii recombinare
··· ···
Mutaţia
÷ Mutaţia este operatorul care introduce modificări noi (inexistente în populaţia unei generaţii);
ceea ce este caracteristic în general mutaţiei şi implicit şi operatorului acesteia corespondent în
algoritmii genetici este că ea se petrece cu o probabilitate scăzută, fiind deci aplicată cu o
probabilitate scăzută (cu probabilitatea de 1/8 în figura de mai sus); operatorul de mutaţie poate
implementa o mutaţie:
o Întâmplătoare: când o porţiune a unui individ selectat va suferi schimbarea valorilor stocate
în genele sale cu alte valori existente în materialul genetic al populaţiei şi are rolul
menţinerii diversităţii în populaţie pentru a preveni populaţia să prezinte o convergenţă
prematură;
o Deliberată: când expunerea la anumite condiţii se transpune în folosirea unei reguli
predeterminate de modificare a valorilor genelor;
o Sub presiunea factorilor de mediu, când valorile genelor se schimbă în raport cu scorul
fenotipului supus modificării genetice;
(evoluţia)
÷ Utilizând doar selecţia singură un algoritm nu va reuşi decât să copieze (cloneze) cel mai bun
individ (fenotip) al său în întreaga populaţie;
÷ Utilizând mutaţia singură un algoritm va reuşi doar să inducă parcurgerea întâmplătoare a
spaţiului de căutare;
÷ Utilizând încrucişarea şi selecţia un algoritm va reuşi să conveargă către o soluţie bună dar nu
sub-optimală (în apropierea celei optime);
÷ Mutaţia şi selecţia (fără încrucişare) într-un algoritm creează algoritmi paraleli, toleranţi la
perturbaţii în căutarea de puncte de maxim local (în terminologia în engleză: hill-climbing);
÷ Utilizarea tuturor operatorilor (mutaţie, încrucişare si selecţie) asigură unui algoritm toate
caracteristicile de definire ale unui algoritm genetic;
··· ···
mutant
părinte
descendenţi
Schema ilustrativă a modului de lucru al unui algoritm genetic clasic
÷ Într-un algoritm genetic clasic (de genul celui ilustrat), pentru a rezolva o problemă, se
generează întâmplător sau se iniţiază cu valori predefinite o populaţie de un volum dat de
genotipuri; cerinţele preliminare algoritmului genetic este existenţa funcţiei obiectiv cu ajutorul
căreia se evaluează scorul unui fenotip în populaţie; algoritmul genetic iterează astfel:
o Repetă
Pasul_1: Utilizând operatorul de selecţie selectează doi cromozomi;
Pasul_2: Utilizând o funcţie discretă de probabilitate pentru alegerea porţiunii de
încrucişat încrucişează cei doi părinţi şi creează descendenţii acestora;
Pasul_3: Cu o mică probabilitate şi utilizând o funcţie discretă de probabilitate pentru
alegerea porţiunii de mutat efectuează mutaţia unui genotip, eventual un descendent al
încrucişării din pasul anterior;
Pasul_4: Iniţializează o nouă populaţie cu noile fenotipuri (de la paşii 2 şi 3 anteriori);
Pasul_5: Completează utilizând operatorul de selecţie aplicat populaţiei de părinţi noua
populaţie cu fenotipuri (până cel puţin la refacerea numărului iniţial de membrii);
Pasul_6: Refă valorile funcţiei de scor ale noii populaţii în conformitate cu noua
compoziţie a acesteia;
o Până când cel mai bun fenotip al populaţiei satisface o condiţie impusă (condiţie care
reprezintă condiţia de sfârşit a algoritmului).
O problemă dificilă de structură biochimică şi formalismul algoritmilor genetici
Lucrarea (Jäntschi şi alţii, 2007) serveşte drept sursă a exemplificării unei probleme dificile
de structură biochimică şi relaţia acesteia cu o proprietate măsurată. Astfel, în lucrare autorii
pornesc de la datele experimentale ale timpilor de retenţie observaţi pentru separarea
cromatografică a bifenililor policloruraţi (PCBs) raportaţi în (Mullin şi alţii, 1984). Folosind
informaţia structurală, o bază de date conţinând descriptori de structură a fost construită.
cel mai bun fenotip
t+1scor
selecţie
selecţie
t+1
scor
t mutaţie încrucişare t+1
Baza de date pentru studiul problemei dificile de relaţie structură-activitate
`MDF` `ready` `PCB_data` `PCB_xval`
`qspr_qsar` `PCB_yval``PCB_tmpx`
Probe atom `i`
Atomic property
Distance metric
Probe atom `j`
Fragmentation criteria
Interaction descriptor Interaction modelMolecular overall
superposing formula Linearization
formula
Fragment of `i`vs. `j`
Metodologia relaţiilor structură-activitate (SAR) în abordarea Familiei de Descriptori Moleculari
(MDF), imagine preluată din (Jäntschi şi Bolboacă, 2008b)
Problema dificilă de relaţie structură chimică - activitate/proprietate măsurată se formulează
astfel: având la dispoziţie o informaţie structurală (obţinută din realizarea topologiei moleculare a
fiecărui compus pe baza legăturilor chimice care se stabilesc între atomi şi realizarea geometriei
moleculare pe baza aplicării modelelor aproximative ale fizicii cuantice şi moleculare) şi o
informaţie rezultată în urma observaţiei experimentale a unei proprietăţi/activităţi pentru fiecare din
cei 209 compuşi în aceleaşi condiţii de mediu, care este cea mai bună relaţie structură-activitate care
să descrie proprietatea/activitatea compuşilor în funcţie de structură.
În acord cu metodologia descrisă în (Jäntschi şi alţii, 2007) informaţia structurală se poate
valorifica construind o familie de descriptori. Fără a mai detalia procedura clasică de rezolvare a
problemei, abordarea din perspectiva unui algoritm genetic aplicat problemei este următoarea:
÷ Populaţia este familia de descriptori moleculari având fiecare genotip (cromozom) descris de
următoarele gene:
o gena d conţinând operatorul de distanţă folosit la construirea descriptorului molecular
(fenotipului), având 2 valori posibile: `g` - distanţă geometrică; `t` - distanţă topologică;
o gena p conţinând proprietatea atomică folosită la construirea fenotipului, cu 6 valori
posibile: `M` - masa atomică relativă; `Q` - sarcina electrică parţială a atomului (obţinută în
aproximaţia Hückel extinsă); `C` - cardinalitatea (proprietate atomică trivială, totdeauna
valoarea sa pentru orice atom este 1); `E` - electronegativitatea atomică (valoare relativă la
scara de electronegativitate Sanderson); `G` - electronegativitatea de grup (valoare obţinută
prin calcularea unei medii geometrice a electronegativităţii grupului de atomi situat în
imediata vecinătate a atomului cercetat); `H` - numărul de atomi de hidrogen ce înconjoară
atomul cercetat;
o gena I conţinând descriptorul de interacţiune, implicând 2 atomi participanţi şi având una
din următoarele 24 de valori (în care s-au folosit notaţiile: d - operatorul de distanţă; p -
proprietatea atomică): `D(d)`, `d(1/d)`, `O(p1)`, ‘o(1/p1)`, `P(p1p2)`, `p(1/p1p2)`, `Q(√p1p2)`,
`q(1/√p1p2)`, `J(p1d)`, `j(1/p1d)`, `K(p1p2d)`, `k(1/p1p2d)`, `L(d√p1p2)`, `l(1/d√p1p2)`,
`V(p1/d)`, `E(p1/d2)`, `W(p12/d)`, `w(p1p2/d)`, `F(p1
2/d2)`, `f(p1p2/d2)`, `S(p12/d3), `s(p1p2/d3)`,
`T(p12/d4)`, `t(p1p2/d4)`, în care prima literă dă valoarea genei şi între paranteze este dată
formula de calcul asociată valorii acesteia;
o gena O codificând suprapunerea interacţiunilor, fiind implementate 6 valori ale acesteia,
două pentru modele în care interacţiunile sunt rare şi la distanţă (`R` şi `r`), două pentru
modelele în care interacţiunile sunt dense dar la distanţă (`M` şi `m`), şi două pentru
modelele în care interacţiunile sunt dense şi apropiate (`D` şi `d`);
o gena f care codifică algoritmul de fragmentare moleculară pe perechi de atomi, care poate
avea una din următoarele 4 valori: `P` - pentru fragmentare bazată pe căi; `D` - pentru
fragmentare bazată pe distanţe; `M` - pentru fragmentare în fragmente maximale; `m` -
pentru fragmentare în fragmente minimale (fragmente triviale conţinând un singur atom);
o gena M care codifică modalitatea de suprapunere globală a interacţiunilor fragmentelor, care
poate lua una din următoarele 19 valori împărţite în 4 grupuri: grupul de mărimi ( `m` -
selectează cea mai mică valoare; `M` - cea mai mare valoare; `n` - cea mai mică valoare
absolută; `N` - cea mai mare valoare absolută); grupul de medii ( `S` - suma; `A` - media
aritmetică după numărul de proprietăţi de fragmente; `a` - media aritmetică după numărul
de fragmente; `B` - media aritmetică după numărul de atomi; `b` - media aritmetică după
numărul de legături); grupul geometric (`P` - multiplicare; `G` - medie geometrică după
numărul de proprietăţi de fragmente; `g` - medie geometrică după numărul de fragmente;
`F` - medie geometrică după numărul de atomi; `f`` - media geometrică după numărul de
legături); grupul armonic (`s` - suma armonică; `H` - medie armonică după numărul de
proprietăţi de fragmente; `h` - medie armonică după numărul de fragmente; `I` - medie
armonică după numărul de atomi; `i`` - media armonică după numărul de legături);
o gena L care rezultă în algoritm în urma unei mutaţii deterministe asupra fenotipului şi
reprezintă unul din cei 6 operatori de linearizare ce urmează: `I` - identitate, `i` - inversa,
`A` - valoarea absolută, `a` - inversa valorii absolute, `L` - logaritmul valorii absolute, `l` -
logaritmul;
÷ Scorul (funcţia obiectiv): având proprietatea măsurată pentru cei 209 compuşi exprimată în şirul
Y (cu 209 valori), urmează:
o Fenotipul, caracterizat de genele care compun cromozomul este transformat în fenotip când
se calculează valorile corespunzătoare genotipului pentru fiecare din cele 209 molecule ale
setului de PCBs.
o Pentru o funcţie obiectiv de estimare a proprietăţii măsurate folosind 2 genotipuri (în cazul
general putând fi un număr oarecare fixat de genotipuri, r), ecuaţia de regresie este de
forma: Ŷ = a0 + a1·Fenotip1 + a2·Fenotip2, (în general: Ŷ = a0 + Σ1≤i≤rai·Fenotipi), unde:
Ŷ este estimatorul proprietăţii măsurate;
a0..a2 sunt coeficienţii care rezultă din minimizarea pătratelor diferenţelor între valorile
măsurate Y şi cele estimate prin intermediul lui Ŷ pentru setul de 209 compuşi;
Fenotip1=Fenotip(Genotip1) şi Fenotip2=Fenotip(Genotip2) sunt fenotipurile (şirurile de
valori ale descriptorilor moleculari obţinuţi prin operaţiile prescrise de genotipurile
Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2 pentru cei 209 compuşi;
o Tăria (scorul) unei perechi de genotipuri (sau mai multe, pentru regresia multivariată) poate
fi exprimată de una din următoarele (Tabelul 18).
Tabelul 18. Funcţii de scor pentru penalizarea regresiilor cu perechi de fenotipuri
Nr. Scor (i=1..2) Semnificaţie Obiectiv Remarci 1 Σ(Y-a0-Σiai·Fenotipi)p Suma
reziduurilor de estimare
minim Uzual p=2; pentru p = 1 şi mai mult pentru p =1/2 există avantajul că se favorizează tendinţa generală în regresie în defavoarea abaterilor grosolane de la ecuaţia de regresie
2 r2(Y,a0+Σiai·Fenotipi) Coeficient dedeterminare
maxim Are avantajul legăturii cu scopul general al optimizării (maximizarea coeficientului de determinare)
÷ Încrucişarea:
o Se selectează (folosind una din metodele de selecţie descrise în Tabelul 17) două genotipuri,
Genotip1=d1p1I1O1f1M1L1 şi Genotip2=d2p2I2O2f2M2L2;
o Se generează două numere aleatoare (din distribuţia uniformă) între 0 şi 6 (fie ele 2 şi 4);
o Se încrucişează Genotip1 cu Genotip2 când se obţin descendenţii Descendent1 =
d1p1I2O2f2M1L1 şi Descendent2 = d2p2I1O1f1M2L2; se obţin fenotipurile acestor descendenţi
şi se adaugă la cultivar;
÷ Mutaţia:
o Se foloseşte o probabilitate de mutaţie α=1/7 (numărul de gene) pentru a decide dacă se
aplică sau nu mutaţia;
o Se alege unul din descendenţi (cel mai tare sau cel mai slab în raport cu scorul, sau
aleatoriu);
o Se generează un număr aleatoriu între 0 şi 6 pentru a decide care genă va suferi mutaţia (fie
acest număr 3);
o Corespunzător lui 3 este gena I; se generează atunci un număr aleatoriu între 1 şi 24
(numărul de valori posibile pe care le permite gena I); folosind valoarea generată aleatoriu
între 1 şi 24 (fie acesta 12) se înlocuieşte valoarea genei I cu noua valoare (pentru 12
valoarea genei I este `k(1/p1p2d)`);
÷ Evoluţia (algoritmul genetic):
o Aşa cum rezultă în acest punct, din întregul populaţiei (care numără, după un calcul simplu)
787968 membrii, implementarea în abordarea algoritmilor genetici necesită generarea şi
păstrarea unui eşantion (cultivar) restrâns din întreaga populaţie (maxim 100 de genotipuri);
fie volumul cultivarului N;
o Se generează aleatoriu N genotipuri;
o Se obţin N fenotipuri asociate celor N genotipuri;
o Se repetă:
Pentru fiecare pereche (în cazul regresiei bivariate) de genotipuri
• Se obţine scorul asociat perechii de fenotipuri: r2(Y,a0+a1·Fenotip1+a2·Fenotip2)
Sfârşit pentru.
Pentru fiecare genotip
• Se obţine scorul genotipului ca valoarea minimă a scorului pe care el îl obţine prin
împerechere cu celelalte genotipuri;
Sfârşit pentru.
Se aleg două genotipuri din cultivar folosind operatorul de selecţie (Tabelul 17) şi se
încrucişează; li se generează fenotipurile şi se adaugă cultivarului (volumul cultivarului
devine N+2);
Se decide dacă unul dintre genotipuri va fi mutat folosind probabilitatea α=1/7; dacă da,
atunci se alege unul dintre genotipurile încrucişate şi se aplică operatorul de mutaţie;
mutantului i se generează fenotipul şi se adaugă cultivarului (în caz favorabil mutaţiei
volumul cultivarului devine N+3);
Folosind scorul genotipurilor se înlătură din cultivar exact atâtea genotipuri până când
volumul cultivarului devine din nou N (minim 0, maxim 3);
o Până când scorul asociat celei mai bune perechi (în cazul regresiei bivariate) de genotipuri
satisface condiţia impusă (de exemplu r2 > 0.99).
÷ Remarcă cu privire la cultivar, mutaţie şi încrucişare:
o Nu orice combinaţie de valori ale genelor produce un fenotip sănătos; la fel mutaţia poate
produce un fenotip mort; acesta este motivul pentru care există posibilitatea ca după rularea
unui ciclu complet de evoluţie, cultivarul să rămână neschimbat (atunci când încrucişarea
urmată de o eventuală mutaţie produc 3 fenotipuri care fie nu se nasc, fie nu se adaptează
mediului);
o Semnificaţia este următoarea: aplicarea secvenţelor de construcţie a fenotipului descrise de
cromozom pentru o anumită moleculă (sau pentru mai multe dintre acestea) poate, în traseul
de construcţie să întâlnească nedeterminări (împărţiri la 0, logaritm din număr negativ);
o Chiar dacă este născut fenotipul, există posibilitatea să nu se adapteze mediului (având de
exemplu valori identice pentru toate moleculele setului, ceea ce-l face nefolositor în
exprimarea unei ecuaţii de regresie cu proprietatea măsurată).
Abordări, variante, adaptări şi alternative ale formalismului algoritmilor genetici
Există multe variante şi adaptări ale algoritmilor genetici menite să îmbunătăţească
performanţele acestora pentru un anume tip de probleme.
Menţionarea tehnicilor derivate şi/sau bazate pe tehnica algoritmilor genetici este suficientă
pentru problematica abordată:
÷ Optimizarea bazată pe strategia coloniilor de furnici (în engleză: Ant colony optimization;
Bouktir şi Slimani, 2005);
÷ Algoritmi bacteriologici (în engleză: Bacteriologic algorithms; Benoit şi alţii, 2005);
÷ Metoda încrucişării entropiei (în engleză: cross-entropy method; De Boer şi alţii, 2005);
÷ Algoritmi culturali (în engleză: Cultural algorithms; Kobti şi alţii, 2004);
÷ Strategii evolutive (în engleză: Evolution strategies; Schwefel, 1995);
÷ Programare evolutivă (în engleză: Evolutionary programming; Fogel şi alţii, 1966);
÷ Optimizare extremistă (în engleză: Extremal optimization; Bak şi Sneppen, 1993);
÷ Adaptare Gausiană (în engleză: Gaussian adaptation; Kjellström, 1991);
÷ Programare genetică (în engleză: genetic programming; Banzhaf şi alţii, 1997);
÷ Algoritmi memetici (în engleză: memetic algorithm; Smith, 2007);
÷ Alte variate, colectate în (Davis, 1991).
Alte abordări conjugă algoritmii genetici cu alte concepte. Următoarele se pot menţiona:
÷ Utilizarea maşinilor cu suport vectorial (în engleză: Support Vector Machines (Brown şi alţii,
2000);
÷ Analiza de localizare a asemănărilor structurale prin histograme secvenţiale (acronim în
engleză: SPLASH; Califano, 2000);
÷ Setul neregulat (în engleză: Rough set; Hvidsten şi alţii, 2001).
Stabilirea necesarelor de materiale şi consumabile, identificarea furnizorilor şi condiţiilor de
procurare, întocmirea documentaţiilor de procurare, derularea licitaţiilor pentru achiziţii
÷ S-au achiziţionat serie de echipamente pentru cercetare:
o Fluorometru (pentru analize în soluţie)
o Staţie Meteo Wireless (pentru monitorizare parametrii de mediu)
o Notebook (pentru preluare date de la fluorometru şi de monitorizare parametrii de
mediu)
÷ S-au achiziţionat o serie de obiecte de inventar necesare cercetării:
o Procesor CPU Intel Xeon Quad Core; Multifunctional Brother; Panou solar fotovoltaic;
Acumulatori; Regulator de încărcare; Afişaj regulator; Invertor; Imprimanta Canon;
Senzor umiditate frunze; Senzor umiditate sol; Senzor temperatura din otel inoxidabil;
Repetitor; Antena Yagi; Repetitor standard wireless
÷ S-au achiziţionat o serie de cărţi:
o Evolutionary Dynamics; Evolutionary Computation: The Fossil Record; The Genetical
Theory of Natural Selection
Planificarea activităţilor experimentale; derularea experimentelor
demonstrative (de testare a metodelor de analiză) ÷ Planificarea activităţilor experimentale urmează schema:
o Selectare activitate biologică de interes (chimie medicală);
o Selectare clasă de compuşi cu potenţă biologică (biochimie);
o Design structură la nivel topologic (chimie matematică);
o Design structură la nivel geometric (chimie cuantică);
o Generare familie de descriptori moleculari (chimie combinatorială);
o Analiză structură-activitate (virtual screening);
o Modelare matematică şi validare statistică (statistică aplicată);
o Selecţie, mutaţie şi încrucişare modele (informatică aplicată);
o Validare potenţă biologică (chimie medicală).
Experimente demonstrative au fost derulate pentru punctul de topire (MP) al aminoacizilor
(fiind incluşi în analiză 31 de aminoacizi, dintre care 23 au format setul de învăţare) când s-a reuşit
îmbunătăţirea capacităţii estimative de la o determinare de 63% (folosind un model structură-
activitate cu o variabilă independentă) 99% (folosind un model structură-activitate cu patru
variabile independente).
Proiectarea şi crearea bazelor de date pentru managementul cercetării şi a
rezultatelor cercetării
÷ Baza de date realizată (denumită MDFV) are următoarea structură (repetitivă pentru fiecare set
de compuşi supus investigaţiilor şi exemplificată pentru setul de 31 de aminoacizi):
o Tabela 31aa_data (3 câmpuri, 31 înregistrări): Id (cheie primară), Mol (abreviere
aminoacid), Hin (câmp binar conţinând designul geometric al structurii obţinut din
optimizarea geometrică a conformaţiei moleculare);
o Tabela 31aa_prop (31 câmpuri, 1 înregistrare): Property (abreviere proprietate), Aib..Val
(câmpuri numerice conţinând valoarea proprietăţii măsurate pentru fiecare compus);
o Tabela 31aa_mdfv (1+31 câmpuri, 2387280 înregistrări): valorile descriptorilor
moleculari indexate după un câmp cheie primară;
o Tabela 31aa__MP (4+31 câmpuri, 7617 înregistrări - pentru MP) - conţinând modelele
structură-activitate cu o variabilă independentă pentru proprietatea MP obţinute în urma
selecţiei pe baza concordanţei folosind algoritmul Goodman-Kruskal;
o Tabela 31aa_qsar (6 câmpuri, număr variabil de înregistrări - 30 pentru MP) - conţinând
modelele structură-activitate mai mult de o variabilă independentă pentru setul 31aa
obţinute în urma încrucişării folosind un algoritm genetic clasic.
÷ Completarea bazelor de date cu cunoştinţele provenite din documentare şi Actualizare
documentare şi respectiv Managementul cunoştinţelor
o Actualizarea documentării cu privire la stadiul cunoaşterii a dus la includerea în evidenţe
a unui număr de 321 de baze de date relevante pentru caracterizarea structurii şi
proprietăţilor chimice ale compuşilor de interes medical, aşa cum s-au enumerat mai sus
în secţiunea "Management cunoştinţe. Identificarea metodelor de analiză. Chimie
Medicală".
o Baza de date a fost completată cu cunoştinţe provenite din Managementul cunoştinţelor
prin includerea în baza de programe a unui algoritm genetic clasic pentru încrucişarea
variabilelor independente aşa cum în lucrarea [Lorentz JÄNTSCHI, Sorana D.
BOLBOACĂ, Mircea V. DIUDEA, Chromatographic Retention Times of Polychlorinated
Biphenyls: from Structural Information to Property Characterization, International Journal of
Molecular Sciences, 8(11), p. 1125-1157, 2007. CAS-AN 2008:423655; CCC&WOS:
000251238700005] a fost prima dată comunicată metoda. Adaptarea acesteia face ca
pentru o funcţie obiectiv de estimare a proprietăţii măsurate folosind 2 genotipuri (în
cazul general putând fi un număr oarecare fixat de genotipuri, r), ecuaţia de regresie este
de forma: Ŷ = a0 + a1·Fenotip1 + a2·Fenotip2, (în general: Ŷ = a0 + Σ1≤i≤rai·Fenotipi),
unde: Ŷ este estimatorul proprietăţii măsurate; a0..a2 sunt coeficienţii care rezultă din
minimizarea pătratelor diferenţelor între valorile măsurate Y şi cele estimate prin
intermediul lui Ŷ pentru setul de compuşi; Fenotip1=Fenotip(Genotip1) şi
Fenotip2=Fenotip(Genotip2) sunt fenotipurile (şirurile de valori ale descriptorilor
moleculari obţinuţi prin operaţiile prescrise de genotipurile Genotip1=d1p1I1O1f1M1L1 şi
Genotip2=d2p2I2O2f2M2L2 pentru compuşi; Tăria (scorul) unei perechi de genotipuri (sau
mai multe, pentru regresia multivariată) se exprimă prin coeficientul de determinare
asociat perechii de fenotipuri: r2(Y,a0+a1·Fenotip1+a2·Fenotip2).
Rezultate publicate
Următoarele publicaţii au fost rezultate din cercetările efectuate în proiect şi menţionează
acest fapt în secţiunea Acknowledgments a lucrării:
÷ lucrare CNCSIS “B+” (BDI: CABI CAB Abstracts şi Thomson Reuters Zoological Record):
Monica ŞTEFU, Sorana D. BOLBOACĂ, Mugur C. BĂLAN, Lorentz JÄNTSCHI, Molecular
Hyperstructures with High Symmetry, Bulletin of University of Agricultural Sciences and
Veterinary Medicine Cluj-Napoca. Horticulture, 65(2), p. 681-686, 2008, AcademicPres, p-
ISSN 1843-5254; e-ISSN 1843-5394.
÷ lucrare indexată în BDI (BDI: CABI CAB Abstracts şi Thomson Reuters Zoological Record):
Lorentz JÄNTSCHI, Sorana D. BOLBOACĂ, Radu E. SESTRAŞ, On about what Can Be Done
and what Cannot Be Done with Genetic Algorithms in Phylogenetic Tree and Gene Sequence
Analyses, Bulletin of University of Agricultural Sciences and Veterinary Medicine Cluj-
Napoca. Horticulture, 65(1), p. 63-70, 2008, AcademicPres, p-ISSN 1843-5254, e-ISSN 1843-
5394.
÷ lucrare ISI (Factor de Impact Jurnal - Thomspon Scientific Reports 2007: 0.859; 2006:
0.767): Lorentz JÄNTSCHI, Violeta POPESCU, Sorana D. BOLBOACĂ, Toxicity Caused by
Para-Substituents of Phenole on Tetrahymena Pyriformis and Structure-Activity Relationships,
Electronic Journal of Biotechnology, 11(3), fulltext 9, DOI: 10.2225/vol11-issue3-fulltext-9,
2008, ISSN 0717-3458.
÷ lucrare ISI (Factor de Impact Jurnal - Thomspon Scientific Reports 2007: 1.103): Lorentz
JÄNTSCHI, Sorana D. BOLBOACĂ, A Structural Modelling Study on Marine Sediments
Toxicity, Marine Drugs, 6(2), p. 372-388, 2008, DOI: 10.3390/md20080017, ISSN 1660-3397.
Cluj-Napoca,
la 28.10.2008