이은수
Contribution Packing algorithm Isotopic distribution 은 화합물 동정에 중요함 이러한 distribution 을 계산하기 위해서 Fast Fourier Transform(FFT) 사용 Ultrahigh resolution mass spectrum 에서는 매우 localized complex patterns(peaks) 이 빈 구간들 사이에 분포 FFT 의 성능 감소 성능 향상을 위한 간단하고 효율적인 packing procedure 를 제안 2 Natural isotopic distribution Packed isotopic distributionRecovered isotopic distribution
Methods Packing/Unpacking Procedure The Packed Isotopic Distribution. Packing procedure 는 natural isotopic distribution 에 있는 individual isotope peaks 사이의 빈 구간 (spacer) 들을 제거 in-excess number of nucleons 에 비례해서 더 낮은 질량쪽으로 Peak 들이 shift peak 들 주변에 있는 mass scale 과 pattern details 는 손실되지 않음 3
Methods The packed distribution f*(m*) can be obtained from the natural distribution f(m) by m : natural mass scales. n m : the in-excess number of nucleons of the peak in the natural mass scale r : the spacer length The natural distribution f(m) can be obtained from the packed distribution f*(m*) by n m * : the in-excess number of nucleons of the peak in the packed mass scale 4
Methods Packing procedure 예 (Fig 1) Natural isotopic distribution 으로부터 spacer = 0.9 Da 을 제거 Peaks 이 lower masses 로 0.0 Da, 0.9 Da,..., n0.9 Da 만큼씩 shift n is the in-excess number of nucleons 전체 packed distribution 은 m* = ~1.45 Da 내에서 잘 fit Recovering the Natural Mass Scale Isotopic distribution 에 있는 centroid peaks 의 위치가 균등하지 않음 정확한 위치는 peak average isotope composition 에 의해 결정 natural mass scales 과 packed mass scales 에 모두 적용 Natural mass scale 에서는 명확하게 centroid peaks 의 위치가 구분됨 packed mass scale 은 packing 되기 때문에 구분하기가 어려움 5
Methods Rationale the in-excess number of nucleons 에 비례하는 수에 의해 lower masses 로 nonmonoisotopic peaks 을 shift element level 에서 mass of each in-excess nucleons 을 줄이는 것과 같음 즉, isotopic species 의 전체 질량이 줄어든다는 것을 말함 For example, heavy isotopes composition 13 C 15 N 을 가지는 isotopic species 는 monoisotopic species 12 C 14 N 보다 2 nucleons 를 더 가짐 즉, isotopic species 의 전체 질량에서 2 가 줄어듬 6
Methods Natural isotopic distributions 에서 conventional polynomial methods 와 Fourier transform methods 의 영향은 packed distribution 의 근거 가 됨 두 경우에, natural isotopic distribution 을 계산한 후, 단지 등록된 isotopes 의 질량들을 변경하 면 packed isotopic distribution 을 만들수 있기 때문 Peak 의 밀도가 요구된 fine structure 를 분해하기에 충분하더라도 전체 sampling 수가 상당히 줄었기 때문에 Fourier transform methods 은 큰 이점이 있음 7
Methods Algorithm 1. natural isotopic distribution 에서 the in-excess number of nucleons 만큼의 spacer length 를 잘라내어 packing For example, ( spacer = 0.8 ) 8 isotopes 현재 질량 Packing 후 질량 32 S S S S
Methods 2. Isotopic distribution 을 계산하기 위해 conventional Fourier transform method 적용 First, calculate the Fourier transform F f* of the “packed” isotopic distribution Next, Multiply by the peak-shape Fourier transform F f* × F peakshape Finally, Inverse-FFT to the mass domain to obtain the “packed” distribution FFT -1 (F f* × F peakshape) 3. Restore the in between peak distances by inserting the spacer length at every interpeak middle points 9
Methods Sampling Range The delimitation of this range has an impact: a range too large : time and memory 낭비 a range too short : 왜곡된 distribution pattern 을 만듬 Packing procedure 의 contribution fine structure patterns 의 손실없이 distribution 범위를 줄임 Patural isotopic distribution 의 prominent peaks 이 범위 R 에 놓여있다면, packed isotopic distribution 의 범위는 대략 1-r 값에 의해 압축 10
Methods Peaks 사이의 평균 거리가 정확하지 않음 packed range R* 에 spacer 의 일부분을 더해야 안전 Rockwood et al 는 natural range R 의 estimate 제안 σ 는 전체 isotopic distribution 의 표준편차 packed prominent range 는 다음의 식으로부터 계산된 값보다 더 큰 minimum power of 2 로 계산됨 11
Methods Peak Shape A Gaussian peak shape is adopted in all the examples in this manuscript. The superposition of the fine structure of individual isotopic peaks calculated by the packing procedure and by the ultrahigh version of the Mercury software (Rockwood peak-wise algorithm) were all computed and plotted along the packed mass scale. In these superpositions, abundances-maximum and mass centroid were the sole fitting parameters considered 즉 abundances-maximum 은 하나로 normalized, centroids 는 0 으로 이동 12
Materials Isotope Data The isotope masses and abundances used in this manuscript come from the file ISOTOPE.DAT distributed with the Mercury software. Compounds bovine insulin (C 254 H 378 N 65 O 75 S 6 ) bovine ubiquitin (C 378 H 629 N 105 O 118 S) tumor suppression protein P16 (C 681 H 1100 N 216 O 208 S 5 ) a single stranded 400 bases long DNA oligomer (C 3900 H 4902 N 1500 O 2401 P 400 ) with molecular weight ∼ 124 kDa referred to as (AGCT)
Materials Computer Configuration The calculations were performed with an Intel Pentium D CPU 3.00 GHz, 2GB RAM, on a 32 bits Windows Vista OS.8 Software Isotopica software registered isotope masses 를 변경하여 ultrahigh resolution packed distribution 을 만드는데 이용 IsoPro software Mercury software sticky isotopic distribution 과 peaks 의 ultrahigh resolution profile 을 만드 는데 이용 14
Results and Discussion 메모리의 performance 를 향상시키는 방법 peak-wise fashion 이 사용 Fourier transforms digital filtering technique 을 이용하여 ultrahigh resolution 에서 isotopic distribution 을 계산 Packing procedure 는 structure 를 가지고 있지 않는 빈 구간의 계산을 하지 않 음 모든 prominent peaks 를 동시에 계산 15
Results and Discussion Ultrahigh mass resolving 에서 packing procedure 의 성능 (Table 1) 전체 sampling 수가 packing procedure 에 의해 8 ~ 32 배 감소 FFT algorithms 는 O(N log N) operations 에 계산 N : the total number of sampling points 계산 시간은 N* 에 연관 sampling 수가 적을수록 계산 속도가 더 빨라짐 Packed approaches 가 unpacked approaches 보다 계산 속도에서 많이 향상 16
Results and Discussion Packed and natural mass scales 에서의 fine structure details 는 손실되지 않고 남음 (Fig 2) Fine structure details of the prominent peaks are simultaneously visible. monoisotopic peak 보다 5 Da, 8 Da 더 높은 peak 들에서 centroid 와 관련된 offset 을 확인 할 수 있음 Packing 된 이후에도 the centroid peaks 주변의 peaks 이 손실없이 남아있기 때문에, centroid 와 관련된 offsets 은 packed and natural mass scales 대해서 같음 17
Results and Discussion The superposition of the Fine isotopic distribution calculated by the Rockwood peak-wise method and by the packing procedure (Fig 3) The finer structure (blue line) 와 the smoother envelope (red line) 가 일 치 Peaks 의 위치를 제외한, detail matching 이 눈에 띄게 정확 18
Results and Discussion Larger compounds 에서 얼마나 정확하게 매칭이 되는지 평가 (Fig 4) Each packed isotopic peak 의 weighted average mass and total abundance 가 계산 red points 로 표시 (packed centroids distribution) Packed centroids 와 reference distributions 은 정확하게 fit despite the maximum shifts 1 Da Maximum fit 를 만들기 위해 Rockwood peak-wise distribution 에서 더 높은 질량쪽으 로 약 3.5 mDa, 3.2 mDa, 3.9 mDa 이동시키는 것을 제외하고는 모든 detail 이 눈에 띄게 매치 19
Results and Discussion Validity of the packing procedure packed distribution 은 packed isotopes masses 로부터 시작해서 계산됨 반면 peak-wise reference distribution 는 먼저 natural isotope masses 로부 터 계산 Then, peaks 사이의 빈 구간을 제거하여 packed scale 로 변환 서로 다른 방향에서 계산되는 계산결과들의 정확한 details matching 은 packing procedure 의 validity 를 말해줌 20
Results and Discussion Centroid deviation 일단 detailed profile 이 정확하게 다시 만들어지면, centroid deviation 은 쉽게 바꿀 수 있음 정확한 procedures 에 의해 얻을 수 있는 expected centroid 에 도달하기 위해서 전체 peak 이 offset 이 됨 매우 정확한 procedure 로는 sticky polynomial method Polynomial method 에서 얻은 정확한 mass values 에 대해서 packed ultrahigh resolution distribution, Mercury, peak-wise Rockwood method 들의 centroid deviations 비교 (Table 2) Ultrahigh resolution distribution 로부터 얻은 centroids packed distribution 이 가장 정확한 centroid values 를 만듬 21
Results and Discussion Superposition with Measured Data 정확한 linear interpolation 을 허용 계산된 data 의 mass 값들이 each individual isotope peak 에 상당히 밀집함 이러한 특징은 계산결과가 mass 에서 mass-to-charge ratio 로 변환한 이후에도 남게 됨 fine details 의 질량 정확도는 instruments 에 달려있음 22
Results and Discussion Spacer Length elemental composition and mass 관한 spacer length 의 의존성이 현재 분석되고 있음 polyaveragine type models 에서 평가된 동향 ultrahigh resolution 에서 상대적으로 큰 molecules 에 대해 conservative spacer length 0.9 Da 이 제안 Visualization. Hughey et al. 은 ultrahigh resolving power 에서 다양한 peaks 의 fine isotopic details 3D representation 을 만들기 위해 mass defect 와 nominal mass 를 separated dimensions 으로 쪼갬 23
Conclusions Fourier method 를 구현한 기존의 software performance 를 향상시키기 위해 packing/unpacking procedure 를 사용 Ultrahigh resolution 에서 isotopic distribution 계산의 향상 complex mixtures 의 compounds 를 동정하기 위한 mass spectrometry 기술 진보에 영향 Packing procedure Fourier transform applications, optics applications, crystallography applications, or other physical-chemical engineering applications 에 유효하게 사용 24