푸른영혼의 별 | Tech Blog
Java Backend Engineer의 기술 블로그입니다.
Spring Boot, MSA, JPA, Kafka, Kubernetes 등 실무 경험을 공유합니다.
주요 프로젝트: Settlement MSA · ASAT · GitHub
Posts (총 187편 · 1 / 19 페이지)
-
-
컴퓨터과학 — *세상이 어떻게 작동하는지 설명하고 예측하는* 7 분야: 계산이론 · 네트워크 · 소프트웨어공학 · 알고리즘 · 운영체제 · 자료구조 · 프로그래밍언어 의 *각자 다른 질문들*
“컴퓨터과학은 *세상이 어떻게 작동하는지 설명하고 예측한다”* — 이 한 문장이 컴퓨터과학을 물리학·화학·생물학과 같은 자연과학 의 자리 에 놓는다. 우리가 만든 인공물(컴퓨터) 이지만, 그 인공물에서 *피해 갈 수 없는 법칙 들이 발견되었고, 그 법칙들을 연구하는 것이 컴퓨터과학이다. 자연과학이 *발견된 우주 를 다룬다면 컴퓨터과학은 발명된 우주 안에서 발견된 우주 를 다룬다.
-
*publishEvent()* 한 줄이 *CPU 코어의 한 cycle* 로 *내려가기* 까지 — 내 K3s 클러스터의 *5 + 2 layer stack dive*
친구가 한 줄 그렸다.
Observer Pattern ↓ Event ↓ Thread ↓ OS Scheduler ↓ CPU“이게 K8s 클러스터에서 어떻게 *내려가나?”*
답: 5 layer 가 아니라 *7 layer 다. *K3s 환경 은 사이에 cgroup 과 containerd 라는 2 개의 가상화 단계 를 더 끼워 넣는다. 그래서 Spring 의
publishEvent()한 줄 이 진짜 CPU 사이클 로 내려가기까지 최소 7 번의 dispatch 가 일어난다. -
바이브 코딩 시대의 PM 과 개발자 — 사라지는 것과 *남는* 것
1년 전엔 개발자의 가치 가 무엇인지 굳이 따질 필요가 없었다. 지금은 PM 이 vibe coding 으로 데모 를 만들고, 디자이너가 Cursor 로 백엔드 를 짠다. 개발자라는 역할 자체가 재정의되고 있는 시점. 그게 어떤 모양일지 — 7년 차에서 본 회고.
-
*DART 공시 → Korean LLM fine-tuning 데이터셋* 만들기 — *XBRL → 자연어 + 종목 영향 추론* 지도 학습 쌍 생성 + LoRA *4-bit Llama-3 / Qwen / Gemma* 의 *현실적 *trade-off 비교*
이 글은 전 글 (news-pipeline 의 5 단계 AI 데이터 정제) 의 후속편. DART (전자공시) 공시 데이터를 *Korean Finance LLM 의 지도 학습 데이터셋 으로 정제 → 변환 → fine-tuning 의 전 사이클 을 실제 코드 (lemuel-quant-core/dart-crawler) 와 함께 정리한다.
-
*뉴스 → 종목별 시그널* 의 *5 단 AI 데이터 파이프라인* — *한국어 tokenization 함정 3 + 도메인 사전 + 노이즈 라벨링 + 2 티어 폴백* 의 *진짜 데이터 정제 경험***
이 글은 lemuel-quant-core 의 news-pipeline 모듈 을 AI 데이터 파이프라인의 *5 단계 *공식 정의 — 원천 → 정제 → 정규화 → 모델 입력 → 추론/학습 — 로 명시적 재정의 한 기록이다. 교과서적 AI/ML 시스템 의 데이터 정제 영역 이 얼마나 *섬세한 결정 의 누적인지* 를 한국어 NLP 의 *3 가지 함정 + 도메인 사전 설계 + 노이즈 라벨링 5 종 + 2 티어 폴백 전략 으로 진짜 코드와 함께 풀어쓴다.
-
*한국어 대화형 *파이썬 학습 프로그램* 을 *CLI + Web 동시* 로 만들고 *9 챕터 27 문제* 로 확장한 기록 — *exec 채점기의 *3 가지 함정* 과 *코드 한 벌로 양쪽* 굴리는 *모노레포 패턴*
이 글은 한국어 *대화형 파이썬 학습 프로그램 (https://github.com/MyoungSoo7/python-tutor) 을 어제 저녁에 시작 해서 오늘 오후 9 챕터 27 문제 + CLI / Web 두 버전 으로 확장 한 기록이다.
-
자바를 *다시* 배운다면 — 7년차의 회고와 AI 시대의 학습 순서
처음 자바를 배운 건 for 문 부터였다. 변수, 조건, 반복, 메서드. 정석. 그렇게 문법 을 외우고 나니 코드를 쓸 수 있게 됐다. 그런데 시스템을 만드는 단계는 거기서 한참 더 가야 했다. 그 거리를 어떻게 줄일 수 있는지 — 7년이 지난 지금이라면 다르게 가르칠 수 있을 거 같다.
-
K3s 에 frp 깔다가 5번 망한 이야기 — image tag · TOML scope · seccomp · entrypoint wrapper
자체 reverse tunnel 서버를 K3s 안에 깔고 싶었다. Cloudflare Tunnel 의 self-host 카운터파트 로. 한 번에 될 줄 알았다. 5번 PR 거쳐서 됐다. 그 5번 다 다른 종류의 함정 이었다.
-
*개인 K3s 6 노드 클러스터* + *대표 프로젝트 3선* — *코드 / 인프라 / 도메인* 의 *3 축이 *동시에 *production-grade* 인 *살아있는 포트폴리오*
이 글은 내가 *집에서 *개인적으로 운영 중인 *K3s 6 노드 클러스터 와, 그 위에서 (또는 그 외곽에서) 살아 움직이는 *대표 프로젝트 3 개 를, 왜 그 기술을 골랐는가 / 어떻게 운영되고 있는가 / 깨졌을 때 어떻게 푸는가 의 3 층 깊이 로 친절하게 풀어쓴 *심층 노트 다.