글또9기:영국직장:데이터사이언티스트

글또9기 | 2024 깃헙 사용 성장목표

채유나 chaeyoonaaa 2024. 1. 21. 21:21
반응형

2년차 데이터 과학자로 진로 고민이 한창 들었던 때 (실제 이직을 시도했던) 이유 중 하나는 현재 업무 개발환경이 개인 역량에 의존도가 높고 테크니컬한 부분에 동료 평가(리뷰) 기회가 적었기 때문이었다.


[퇴근 후 불켜진 빌딩 사이를 지나며 했던 생각들]



사내 데이터 사이언티스트 직책을 가진 팀원들은 파이썬/또는 R 프로그래밍을 중급 수준으로 활용하며 깃과 같은 버전 컨트롤에 대한 이해 등을 하고 있다. 다만, 팀 특성 + 적은 인원의 한계로 [분석가] 역할을 하는 사람 1인을 두고 다른 역할(주로 정책가나 PM, 가끔은 다른 모델러 등)을 가진 분들이 추가로 붙어 목표 결과물을 딜리버리 하는 경우가 대부분이다. 최소 모델을 더 발전시키지 못하거나 기술부채가 쌓이는 문제가 있다.
 
 

상대적으로 협업 도구 활용이 낮은 것 또한 아쉽게 생각하고 있다. 2023년 1년동안 개인 계정과 회사 업무용 잔디를 조금은 심었다. 2024년에는 조금 더 집중해서 포트폴리오를 예쁘게 쌓으려 목표하고 있다.

 
 
 
우리 조직은 보통 하나의 프로젝트에 짧게는 2주 길게는 2-3개월 호흡으로 스프린트가 이뤄진다.


나는 처음 접하는 도메인 이해도가 낮아 1년 반 정도 근무했을 때가 되어서야 비로소 짧게 짧게 조각내어 했던 것들을 메인스트림으로 이어서 이해할 수 있는 정도가 되었다. 그리고 그 때쯤 우연히 다른 팀원들과 총 5명이서 단기과제를 맡아 2개월 정도 협업을 했고, 당시 경험이 굉장히 신선해 자극을 많이 받고 개발 공부에 대한 동기 부여를 많이 받았다. 이전에도 사실 다른 1명과 같이 코드 교류를 시도했던 적이 있긴 했지만, 그 분께서 너무나 협업에 대한 개념이 없어 (컨플릭트 해소를 하지 않고 깃 머지를 하는 등) 일방적으로 가르쳐야 하는 범위가 까마득하게 늘어나는 바람에 원했던 쌍방향 리뷰가 잘 되지 않았다.
 




마침 새해부터 개편된 조직 운영 방향에 따라 시니어들과 페어가 있을 예정이라 하고 일한 내용을 좀 더 시스템적으로 리뷰할 수 있도록 한다고 한다. 개별적으로 흩어져있던 데이터 사이언스팀 조직들을 중앙 통제하에 하나로 묶어 각 로컬팀에서 부족한 시니어 리소스를 공동으로 쉐어할 수 있게 목표하고 있다. 이를 잘 활용하기 위해서는 이전까지 독립적으로 개발했던 내용을 잘 정리하는 게 필요하여 한창 코드 히스토리와 관련 문서를 정리하고 있는 중이다. 12월과 1월은 우선 여러 디렉토리에 흩어져있는 코드들을 솎아내고 필요에 따라 묶는 작업을 주로 하였다. 업무 계정에 3개의 Orgs를 가지고 있고 내가 가진 프라이빗 리포지토리끼리 서로 미러링 하거나 테스트 용도로 활용하고 있다. 특히 서브트리를 유용하게 이용하고 있다.

깃허브 리포지토리(Repository) 하나로 합치기

요새 알고리즘을 공부하며 백준, 프로그래머스 등을 풀기 시작했고, 알고리즘에 관련된 책도 보기 시작했다. 그러면서 깃허브에 코드를 저장하고 싶어 리포지토리를 하나, 둘 만들다 보니 알고

hanco.tistory.com


나의 메인 워크스트림에는 (의도적으로) 모듈 단위로 리포지토리를 별도 생성하고 중복된 기능을 요구하는 프로젝트끼리 리포를 조합해 하나의 플로우를 완성하는 방식이 잘 맞다. 예를 들어, 데이터를 불러오고 프로세싱하는 리포1과 2가 나누기 연산을 하는 메인 리포 A와 각각 결합하여 1A와 1B를 운영하고 데이터 아키텍쳐 변화에 따라 리포1과 2는 각각 변하는 방식이다. 이때 고정적인 메인 리포A를 서브트리로 1과 2에 각각 넣어둔 후 작업하면 편하게 되었다. 왜냐하면 처음부터 1, 2, A 등을 모두 리뷰요청하기 어렵기 때문이다. 중요도가 가장 높은 2A만 리뷰 요청을 하고 이를 통해 배운 내용을 1A로 적용하는 건 내가 자율적으로 해야 할 것이다.
 

 
조직 내에 지속적으로 화두가 되는 주제 또한 Reproducible analytical pipelines (RAP) 등과 같아서 이러한 방향성을 가지고 움직이는 게 가능할 것 같다. 로컬 머신에서 단독으로 가지고 있던 내용들고 부끄럽지만 가능하면 빠른 시일 내에 정리하여 팀원들에게 투명하게 공유할 수 있을 만큼 노력하겠다. 2024년 새해는, 그래서 이전까지 일한 모든 내용을 한 단계 더 업그레이드하는 방향으로 움직이려 하고 이를 위한 도구로 깃헙 사용 활성화를 택하였다. 보다 나은 기록을 할 수 있게 부지런하겠다.

 

반응형