StarDrop
Gaussian
Toxicity prediction tool(derek)
Hyperchem
Scigress
Prediction Data Miner(Leadscope)
 
 
Home > Prediction Software > Prediction Data Miner
 
Leadscope : Predictive Mining Tools
 
1997년 창립되어 Pfizer와 초기제품을 공동개발하고 US FDA, US EPA, ISS (Italy), Health Canada, Danish EPA, EU ECB와 공동 연구 개발한 Leadscope 소프트웨어 및 데이터베이스 제품은 Life Science Discovery를 위한 Predictive Data Mining을 위한 최적의 도구를 제공한다. Pfizer와 공동 개발한 27,000 개 이상의 Structure features(keys)를 Descriptor로 사용하여 Medicinal Chemist에게 보다 직관적인 화학구조 기반의 Clustering, 유일 무이한 Feature Combination 기능, Scaffolds, R-Group 분석이 가능하며, 같은 독성 프로토콜 별로 잘 정리된 상업용 Leadscope 독성 데이터베이스와 연동하여 특정 독성을 나타내는 화학구조적 특징을 사용자 라이브러리에서 분석하거나 Toxicophore들을 손쉽게 추출 가능한 라이브러리 디자인에 사용될 예측 마이닝 도구이다.
 
1.Target 고객
2. 용도 및 응용분야
3. 주요 특징
4. 장점
5. 제품라인
6. Selected Leadscope 관련 논문
Target 고객
 
Medicinal Chemist (Lead Generation & Lead Optimization)
ADMET 예측 관련 Modeler
Cheminformatics scientist
HTS scientist
 
용도 및 응용 분야
 
In silico toxicology (Discovery Tox, Product Safety)
Data Mining
HTS Analysis
Lead Optimization
Compound Acquisition
 
주요 특징
  1. Pfizer와 공동 개발한 27,000 개 이상의 Structure features 및 feature combining 기능
   (동적인 새로운 Scaffold 생성 알고리즘) 으로 새로운 Scaffold에 대한 제약 없이 분석 가능
 
Amino acids
Bases, nucleosides
Benzenes
Carbocycles
Carbohydrates
Elements
Functional Groups
Heterocycles
Naphthalenes
Peptidominetics
Pharmacophores
Protective Groups
Spacer groups
  - 동적인 새로운 Scaffold 생성 알고리즘
  - 사용자 정의의 structure feature branch 추가 가능(지식 추가)
 
 
2. Leadscope 에서의 데이터 마이닝
 
 
 

3. 사용자 라이브러리에 대한 Clustering, Feature Combination, Scaffolds, R-Group 분석.
 
   
 
- 특히 강력한 Feature combination 기능을 사용하여 27,000개 이상의 Structure features(Substructure)들을 합하여(Union) 여러 가지 새로운 new scaffold 들을 생성하여 라이브러리를 분석 가능
- 분석된 structure feature 중 2D-Pharmacophores 분석은 Pharmacophore가 interaction 할 수 있는 site에 대한 정보를 제공하고, 골격 구조와 같이 표현되므로 라이브러리 분석에 큰 도움이 됨
 
 

4. Data Visualization
 
   
 
 
 

5. 분석을 위한 편리한 회사 라이브러리 Import
 
 
장점
 

1. 사용자 라이브러리로부터 Toxicophore를 프로그램 구축이나 큰 노력 없이 빠르게 간편하게 분석 추출 가능

2. 클릭만으로 라이브러리 데이터 또는 화학구조적 특징의 유사성에 의한 clustering 가능
(Hierarchical, Jarvis-Patrick, K-MEANS 등 Non-Hierarchical)

3. 사용자 라이브러리로부터 27,000 개 이상의 Structure features를 사용한 빠른 Diversity 분석 가능
(Project Hierarchy에 Amino acids와 같은 일반적인 화학구조 특징뿐 아니라 Natural products, peptidomimetics, protective groups, Pharmacophore 등의 화학구조 특징으로도 분석됨.)

4. Feature Combination 기능을 이용하여 화학구조에 기반한 RPSA (Recursive Partitioning with Simulated Annealing)
분석으로 active class 들을 찾을 수 있으며, 특정 Feature를 선택하여 분석 가능


5. 사용자 라이브러리로부터 Scaffold 추출 및 R-group 분석 가능

자동으로 사용자 라이브러리에 대한 Scaffold 추출선택된 Scaffold 주변의 모든 치환체를 탐색하여 activity 및 endpoint에
미치는 영향 가시화 - Structural domain visualization

6. 바로 Modeling 분석이 가능하도록 같은 Protocol을 가진 물질 별로 잘 정리된 상업용 Database 제공

(EPA의 DSSTOX, FDA PAFA, FDA Toxicity, NTP, RTECS, Known Drug Database, FDA Genetic Toxicity,
FDA Chronic/subchronic FDA SAR Gentox 등 다수)

7. 계산된 Property 및 실험 데이터에 의한 filtering 기능

자동 계산 제공하는 Property 종류: Parent MW, Hydrogen Bond Donor, Lipinski Score, Hydrogen Bond Acceptor, Polar Surface Area, MW, ALogP, Rotatable Bonds, Parent Atom counts 등


Hydrogen Bond Doner, Lipinski Score 등 계산된 Property 및 import된 실험 데이터의 범위를 원터치로 마우스로 스크롤만으로 원하는 범위의 Property를 만족하는 라이브러리 필터링을 하여 추가적인 분석을 손쉽게 하게 해줌

8. Library 비교

9. Predictive Data Miner로 데이터 마이닝 모델을 자동 구축

분자 다양성 분석
데이터 set 들 사이의 화학구조 상관관계
OECD 가이드라인과 호환되는 도메인 분석전문가의 structural alerts (Aldo Benigni)

 
제품 라인
  1. 소프트웨어
 
Leadscope Enterprise

- 자체서버에 서버용 소프트웨어를 설치할 수 있고, 로드 할 수 있는 화합물 수에 대한 제한 없음
- 27,000 medicinal chemistry building blocks에 의한 분류, Recursive partitioning with simulated annealing (RPSA),
Structure-based clustering, Scaffolding, Classifiers 등 다양한 화학구조에 의한 그룹핑 방법 제공
- R-Group 분석
- Substructure, similarity 등 화학구조 검색 방법 제공
- 실험결과 검색 - species, sex, dosage, duration, route of exposure, toxic effect 및 results
- ALogP, polar surface area, Lipinski scores 등 Drug-like Property 계산
- Requirement (Server):
Win2k/XP server 또는 Linux - RHE or Solaris 8 or 9
Dual 1GHz CPUs; 2GB RAM; 100GB Disk
Oracle 8i or 9i
- Requirement (Client):
Windows 2000 또는 XP
PIII 700MHz processor 이상; 512MB RAM; 1G of disk space 이상
 

Leadscope Hosted

- Leadscope Enterprise와 동일한 소프트웨어 기능 보유
- 자체 서버를 설치하지 않고, 미국 Leadscope 사의 서버 소프트웨어 사용
- 로드 할 수 있는 화합물 수에 대한 제한: 250,000
- Requirement (Client):
Windows 2000 또는 XP
PIII 700MHz processor 이상; 512MB RAM; 1G of disk space 이상
 

Leadscope Personal

- Leadscope Enterprise와 동일한 소프트웨어 기능 보유
- Standalone으로 단독 사용
- 로드 할 수 있는 화합물 수에 대한 제한: 100,000
- Requirement (Client):
Windows 2000 또는 XP
PIII 700MHz processor 이상; 512MB RAM; 1G of disk space 이상
 

Leadscope Predictive Data Miner

- 예측 데이터 마이닝 모델 구축 소프트웨어 추가 모듈
- 생물학과 화학 사이의 숨겨진 관련성 탐색
- 분자 다양성 분석
- 지식을 저장하고 관리
- Customized training sets 구축
- 전문가 Rule이나 소프트웨어 학습 Rule 추가 가능
- PLS 및 PLR (partial logistic regression) 사용가능
- OECD 가이드라인과 호환되는 도메인 분석
  Requirement:
Leadscope® Enterprise 또는 Leadscope® Hosted 또는 Leadscope® Personal 소프트웨어
 

Leadscope Database Manager

- FDA 데이터베이스 및 사용자 데이터 기초 분석용
- 화학라이브러리 파일: SD file로부터 Import 가능
- 로드 할 수 있는 화합물 수에 대한 제한: 10,000
- 사용 가능한 기능: Pre-defined chemical feature hierarchy, Graphical views, Property filters, Molecular spreadsheet,
화학구조 검색 방법 제공(Substructure, similarity 등), 실험결과 검색 - species, sex, dosage, duration, route of exposure,
toxic effect 및 results
- Requirement (Client):
Windows 2000 또는 XP
PIII 700MHz processor 이상; 512MB RAM; 1G of disk space 이상
  2. 데이터베이스
 

Leadscope Toxicity Database

- 약 17만 건의 화학구조 및 독성 데이터
- RTECS + NTP + EPA DSSTox 데이터 통합
- 다양한 Endpoint 커버: 급성독성, multiple dose (표적장기독성), 발암성, 유전독성, 생식독성, 자극 데이터 등
- 화학구조 검색 방법 가능 (Substructure, similarity 등)
- 실험결과 검색 - species, sex, dosage, duration, route of exposure, toxic effect 및 results
- Requirement : Leadscope® Enterprise 또는 Leadscope® Hosted
 

Leadscope® Known Drugs Database

- 약 14,000 건의 화학구조 및 의약분류기준
- 화학구조 검색 방법 가능 (Substructure, similarity 등)
- 각 물질 별 의약분류기준 의약분류기준에 따라 검색 가능
- Requirement :
Leadscope® Enterprise 또는 Leadscope® Hosted 또는 Leadscope® Personal 소프트웨어
 

FDA SAR Genetox Database

- QSAR 실험의 Training set으로 바로 사용 가능한 고품질 유전독성 데이터베이스 (SAR-Ready)
- 2,418 물질 및 88,871 독성 데이터 커버
- 주요 데이터 소스 : FDA NDA (new drug approval), FCN (food contact notification), NTP, CCRIS 및 주요 데이터 소스
- 17 종류의 유전독성 Endpoint 제공 (6 Strain level calls, 3 Cell level calls, 4 Cell level calls, 4 Species level)
- 다양한 연구 타입 제공 (bacterial mutagenesis, in vitro mammalian mutagenesis, in vitro chromosome aberration, in vivo micronucleus)
- Requirement :
Leadscope® Enterprise 또는 Leadscope® Hosted 또는 Leadscope® Personal 또는 Leadscope® Database Manager 소프트웨어
 

기타 FDA 데이터베이스

- FDA CFSAN Chronic/subchronic Database
- FDA CFSAN 2007 Repro-Developmental Database
- FDA CDER 2007 Chronic/subchronic Database
- FDA CDER 2007 Genetox Database
- FDA CFSAN 2007 Genetox Database
 
Selected Leadscope 관련 논문
 
Chihae Yang et al, The Art of Data Mining the Minefield of Toxicity Database to link Chemistry to Biology, Current Computer-Aided Drug Design, 2006, 2, 135-150
Chihae Yang et al, Comparison of Methods for Sequential Screening of Large Compound Sets, Combinatorial Chemistry & High Throughput Screening, 2006, 9, 115-122
Chihae Yang et al, Landscape of current toxicity databases and database standards, Current Opinion in Drug Discovery & Development, 2006. 9(1). 124-133
Correlating gene expression with chemical scaffolds of cytotoxic agents: Ellipticines as substrates and inhibitors of MDR1 (ABCB1). Y. Huang, P.E. Blower, C. Yang, C. Barbacioru, Z. Dai, Y. Zhang, J.J. Xiao, K.K. Chan, W. Sadee (2005) Pharmacogen 5:112-125.
Yang, C.; Cross, K.; Myatt, G.; Blower, P.; Rathman, J. Building Predictive Models For PTP1B Inhibitors Based On Discriminating Structural Features By Reassembling Medicinal Chemistry Building Blocks, J. Med. Chem., 2004, 47, 5984-5994.
Myatt, G.J.; Zhengming, C.; Yang, C.; Cross, K.; Blower, P. Data Mining and Visualization in Drug Discovery, AAPS Newsletter, September 2004 16-19.
Blower, P.; Cross, K.; Fligner, M.; Myatt, G.; Verducci, J.; and Yang, C. Systematic analysis of large screening sets, Curr. Drug Disc. Technol., 2004, 37-47.
Cross, K.P.; Myatt, G.; Yang, C.; Fligner, M.F.;Verducci, J.S.; Blower, Jr., P.E. Finding Discriminating Structural Features by Reassembling Common Building Blocks, J. Med. Chem., 2003, 46, 4770-4775.
Blower, P. E. Jr.; Yang, C; Fligner, M. A.; Verducci, J. S.; Yu, L.; Richman, S.; Weinstein, J. N. Pharmacogenomic Analysis: Correlating Molecular Substructure Classes with Microarray Gene Expression Data, Pharmacogen. J. 2002, 2, 259-271.
Fligner, M. A.; Verducci, J. S.; Blower, P. E. Jr. A Modification of the Jaccard/Tanimoto Similarity Index for Diverse Selection of Chemical Compounds Using Binary Strings, Technometrics, 2002, 44, 110-19.
P. Blower, M. Fligner, J. Verducci, and J. Bjoraker; On Combining Recursive Partitioning and Simulated Annealing To Detect Groups of Biologically Active Compounds, J. Chem. Inf. Comput. Sci., 2002, 42, 393-404.
Yang, C.; Bakshi, B.R.; Rathman, J.F.; and Blower Jr., P. E. Multiscale and Bayesian approaches to data analysis in genomics highthroughput screening, Curr. Opin. Drug Disc. Devel. 2002, 5
Johnson, D. E.; Blower, P. E., Jr.; Myatt, G. J.; Wolfgang, G. H. I. Chem-tox informatics: data mining using a medicinal chemistry building block approach, Curr. Opin. Drug Discovery Dev. 2001, 4, 92-101.
Roberts, G.; Myatt, G. J.; Johnson, W. P.; Cross, K. P.; Blower, P. E. Jr. LeadScope: Software for Exploring Large Sets of Screening Data, J. Chem. Inf. Comput. Sci. 2000, 40, 1302-1314.
 
영역1