본문 바로가기
생명과학 이야기

DeepGoWeb을 통한 한가지 기능 예측시도

by 인터넷떠돌이 2022. 12. 23.
반응형

안녕하세요?

 

이번 포스팅은 오랫만에 생명과학이야기라고 할 수 있는데, 일단 여기서는 다른것도 아니고 유전자의 기능을 한번 알아보기 위해서 DeepGoWeb이라는 툴을 이용해서 알아보는 과정을 한번 다루어 보고자 합니다. 일단 이 탐색은 실패로 끝나기는 했지만, 그래도 포스팅할 가치는 있다고 생각을 해서 이번 포스팅을 준비하게 되었습니다. 일단 이렇게 준비를 했기 때문에, 어떻게 해서건 작업을 들어가 보고자 합니다.

 

먼저 원하는 DNA sequence를 입력해서 위 스크린샷과 같이 예측되는 결과를 얻도록 합니다. 여기서 정말 중요하다고 생각하는 것은 저 발생과정에서 이 유전자가 관여하는 지를 알아보는 것 입니다.

 

먼저 발달과정을 클릭해서 나오는 윈도우 입니다. 이런 윈도우에서 당장은 얻을 것이 없어 보이기도 합니다만, 일단 침착하게 내려가 보도록 합니다.

 

annotation이라고 해서 주석을 달아놓은 것이 있는데, 이게 바로 정보입니다. 그런데 너무 많은 정보가 있기 때문에 혼란스러우니, 필터링을 거쳐야 하는데, 여기서는 위 스크린샷에서 볼 수 있는 것처럼 포유동물에 한정 시키도록 하고, 그 다음으로는 gene인 것만 가지고 오도록 합니다.

 

 

그리고 나서 다음으로 진행한 것은 이렇게 필터링이 된 결과를 보도록 합니다. 우연히도 유전자가 LDL 수용체와 관련이 되어 있는 것을 확인할 수 있습니다.

 

먼저 유전자의 심볼에 대한 것을 복사해 주도록 합니다. 그리고 나서 여기서는 더 얻을 수 있는 것이 없기는 없기 때문에, 다음으로 넘어 가 보도록 합니다.

 

다음으로는 NCBI의 홈페이지로 가서 데이터 베이스 선택에서 전에 유전자로 검색을 했기 때문에, 일단 유전자를 선택해 보도록 합니다. 당연 Gene를 선택해서 유전자 심볼을 검색해 주도록 합니다.

 

그리고 나서 다음으로 진행하면, 위 스크린샷에서 볼 수 있는 것처럼, 일단 유전자에 대해서 가지고 올 수 있는 것이 많이 있습니다. 여기서 가장 중요한 것이 일단 NC로 시작하는 코드번호인데, 이 번호를 가지고 와서, 복사해 주도록 합니다.

 

이번에는 같은 NCBI의 홈페이지로 가서 데이터 베이스를 검색해 봐야 하는데, 여기서는 위 스크린샷에서 볼 수 있는 것처럼, 일단 nucleotide를 입력해서 유전자의 DNA sequence를 먼저 알아봐서 결과가 맞는지 아닌지 알아보도록 합니다.

 

그런데 문제가 생겼습니다. 일단 위 스크린샷에서 볼 수 있는 것처럼 일단은, 원래 입력한 DNA sequence에 비해서 너무나 긴 sequence가 생긴 것을 확인할 수 있었습니다.

 

일단 여기서 문제가 있다면 하나 있는 것이, 우선 DeepGoWeb은 DNA sequence가 아니라 protein의 아미노산 서열을 입력받아서 이를 가지고 결과를 만들어 내는 툴 이었습니다. 여기서 부터 무언가가 제대로 어긋난 상황이라는 생각이 드는데, 일단 이걸 제대로 알아보니 않아서 상당한 삽질을 하게 되었습니다. 아무튼 이렇게 해서 DeepGoWeb을 사용한 유전자의 기능을 알아보는 시도는 실패했습니다만, 그래도 어느정도 시도를 하였고, 이에 대해서 한번 생각해 볼 수 있는 계기가 되었습니다.

반응형