반응형

2023/02 7

Histopathology를 다루기 위한 MIL

Bulk-sequencing 혹은 Spatial transcriptomics 데이터의 Phenotype을 보기 위해, Histopathology (혹은 Whole-slide Imaging) 데이터와 결합하여 보는 경우가 많아졌다. 나는 이 연구를 시작하게 된 계기는, 하버드 Peter park 랩에서 Normal tissue에 대한 CNV 연구가 활발한데, 정상인에서 발견되는 초기암으로 생각되는 CNV의 phenotype을 WSI에서 과연 볼 수 있을까? 에 대한 주제로 코웍을 하게 된 것인데, 만약 Histopathology에서 CNV를 어느정도 탐지할 수 있는 능력이 있다면, 때 초기암의 phenotype으로 여겨지기도 하는 hyperplasia같은 영역을 중요한 patch로 꼽지 않을까? 하는 질문..

[미국 포닥] 탑스쿨 포닥 준비과정 리뷰 후기

일기 처럼 적는 이 글에서, 포닥을 준비하시는 분들께 조금이나마 도움이 되었으면 하지만 정말 제 개인적이고 주관적인 생각이 포함된 글이며 분야마다 상이할 수 있으니 귀엽게 봐주시면 감사하겠습니다. 2022년에 전문연구요원이 끝나는 시기에 맞춰, 미국 포닥 (PostDoc)을 준비했다. COVID-19 오미크론으로 NIW로 미국 영주권 비자인터뷰가 늦어지는 바람에, 2023년 랜딩을 목표로 정말 천천히, 느릿느릿 준비했다. 탑스쿨이라고 할 수 있는 곳에서는 아래의 4곳에서 순서대로 최종 오퍼를 받았는데, 여기까지 달려왔던 여정들을 한 번 정리해보고자 한다. 1. 하버드 의과대학, Department of BioMedical Informatics, Genomics lab 2. 스탠포드 의과대학, Radiol..

Stigmatized./Essay 2023.02.21

URL 이미지 다운로더 ImageURL v1.1

다운로드 링크1 - ImageURL_1.1.zip 다운로드 링크2 - ImageURL_1.1.zip (google drive) URL 로부터 이미지를 다운받아야 하는 작업이 필요하다는 분이 있어서, 프로그램을 하나 만들어봤습니다. 이 프로그램은 사용자가 입력한 URL로부터 이미지를 자동으로 확인하고, Space (혹은 클릭) 키보드 입력을 통해서 자동으로 이미지를 다운로드 할 수 있는 프로그램입니다. 프로그램의 주요 기능은 여러 이미지를 키보드를 통해 넘기고, space를 통해 다운로드 하는 기능입니다. 입력된 URL 인터넷 주소에서 이미지만 추출하여 다운로드할 수 있는 기능을 제공합니다. 사용법은 다음과 같습니다. 1. ① 번에 검색하고자 하는 URL 인터넷 주소를 입력하세요. 2. ② 번을 클릭하여,..

NIW DS-260 P4 주변 케이스 체크하기

2021년 12월 초에 P3 (DQ: documentarily qualified) 를 받았고, 기다리는 도중에 2022년 4월, 심지어는 2022년 8월에 P3를 받으신분도 2023년 2월달에 P4를 받았다는 케이스를 몇개 보았다. 너무 부럽기도 하고, 내 케이스만 왜이렇게 늦는 것일 까, 멘붕이 와서 Visa Status Check 에서 내 케이스 주변을 살펴보았다. * 영사전자신청센터 CEAC (Consular Electronic Application Center) https://ceac.state.gov/CEACStatTracker/Status.aspx CEAC ceac.state.gov 위 웹사이트에서는 나의 Case ID를 알면 상태를 조회할 수 있다. 내 CASE 번호를 중심으로 맨 끝자리 숫..

Stigmatized./Essay 2023.02.13

Single Cell Analysis Best Practice 정리해보기

BIML, single cell 강의 들으면서 정리해본 내용입니다. 1. Data Format Annotated data: Single cell data를 효율적으로 구성한 데이터 format obsp: (n_obs, n_vars)인 sparse matrix dictionary 일반적으로 n_obs는 Cell의 수이고, n_vars는 Gene의 수 obsm: (n_obs, n_comps)인 sparse matrix dictionary 여기서 n_comps는 구성 요소의 수. -> 차원 감소 또는 클러스터링 알고리즘의 결과를 저장하는 데 사용 (PCA 또는 t-SNE 시각화 등의 2차원 정보 등을 저장) varm: (n_vars, n_vars)인 sparse matrix dictionary 여기서 n_va..

tf.keras에서 Transformer의 self attention 및 중요도

1. Transformer에서 self-attention의 의미 Self-attention은 자연어 텍스트와 같은 Sequential data를 처리하기 위한 Transformer layer에 있는 메커니즘입니다. 이를 통해 모델은 시퀀스의 중요한 부분에 집중하여 시퀀스의 각 요소에 대한 표현을 계산할 수 있습니다. Attention score는 위 그림처럼, 2차원의 word vector에 대해 Matrix multiplication이 수행됩니다. Word embedding이 잘 되어있다면, 비슷한 의미를 가지는 단어는 비슷한 Feature pattern을 보일 것입니다. 따라서, 같은 문장의 MatMul을 통해 만들어진 Attention score (Matrix)는 '유사도' 처럼 작동할 것입니다. ..

국가별 Visa class에 따른 발급 수 확인하기

Yemen 국적을 가지고, 중국의 AI 연구소에서 일하는 친구가 있습니다. 그 친구의 친구는 Nigeria 출신인데, 같이 중국에서 일하고 있습니다. 이 두 친구는 Ph.D. 와 충분한 수의 논문과 인용, 그리고 특허를 갖고 있기에 별 문제 없이 NIW의 i-140을 승인받았습니다. 저는 현재 NIW를 진행중이며, DS-260의 P3 (Document Qualitifed) 이후 14개월동안 비자인터뷰 날짜를 통보받지 못한 상황인데, 두친구의 time-line을 보고는 깜짝 놀랐습니다. P3: 2022. 12. 07 P4: 2023. 02. 03 만으로 3개월도 안되어 인터뷰 통보를 받았습니다. 이는 국가별로 quota가 정해져있기 때문으로 해석되는데, Monthly Immigrant Visa Issuan..

Stigmatized./Essay 2023.02.04
반응형