분류 전체보기(89)
-
[네트워크/보안] Website Fingerprinting이란? Website FingerPrinting 실습
Website Fingerprinting이 무엇인지 알아보고, Website Fingerprinting이 Tor를 어떻게 우회하는지에 대해 간단하게 알아보도록 하겠습니다.그리고 Website Fingerprinting을 Pycharm Jupyter NoteBook 환경에서실습할 수 있는 있는 방법에 대해서 알아보겠습니다.Pyshark를 통해서 패킷을 캡처하는 과정까지 실습하고,이후 ML/DL로 모델 학습하는 과정은 데이터셋이 많이 필요하다는 한계가 있어시뮬레이션 과정을 설명하도록 하겠습니다. Tor가 기본적으로 제공하는 보호 기능Tor는 사용자의 IP 주소와 접속 대상 웹사이트를 서로 분리하기 위해 다단계 중계 (onion routing) 를 사용합니다. 데이터는 3개의 릴레이 노드(Guard, Midd..
2025.05.20 -
[네트워크] Tor 네트워크란 무엇인가?
오늘은 Tor 네트워크에 대해서 알아보겠습니다.유튜버 Hussein Nasser의 "How Tor Work? (The Onion Router)" 강의를 참고하였습니다.Tor 네트워크를 처음 접하는 입장에서 이해가 잘 되도록 쉽고 직관적으로 설명해 주셔서많은 도움이 되었습니다.유투브 원본 영상 링크를 함께 남깁니다. 더 자세한 설명은 영상을 참고해 주세요https://youtu.be/gIkzx7-s2RU?si=K0v31QNo_CHxMaQU Normal Request사용자가 일반적으로 인터넷에 접속할 때 어떤 흐름으로 진행이 될까요?IP가 5.5.5.5인 사용자가 웹 서버 9.9.9.9로 요청을 보냅니다.TCP 패킷에는 다음과 같은 정보가 담깁니다.Source IP / Port : 5.5.5.5 / 8992..
2025.05.19 -
[딥러닝] ControlNet + Stable Diffusion - Scribble 기능으로 이미지 생성하기
최근 몇 년 사이 AI가 생성한 이미지들이 사람의 손으로 그린 그림과 구분하기 어려울 만큼 정교해졌습니다.그 중심에는 Diffusion Model이라는 생성 모델이 존재합니다. 특히, 이 모델을 효율적으로 구현한 Stable Diffusion, 그리고 이를 구조적으로 제어할 수 있도록 도와주는 ControlNet은 현재 가장 주목받는 기술 중 하나입니다. Diffusion Model: 노이즈를 통한 생성Diffusion Model은 데이터 생성 과정을 정확히 반대로 생각하는 발상에서 시작합니다. Forward Process 이 모델은 원래 존재하는 이미지를 점차 노이즈로 오염시키는 과정을 먼저 정의합니다. 이 과정을 Forward Process라고 하며, 수학적으로는 각 시간 t마다 조금씩 가우시안 ..
2025.05.15 -
[머신러닝] 공모전 추천 시스템(2) - chatGPT OpenAI 활용
OpenAI 패키지 임포트import openai # OpenAI 패키지 임포트import time # 시간 관련 함수 사용을 위해 임포트# OpenAI API 키 설정openai.api_key = ${openai-api-key}OpenAI 활용하여, 전처리된 데이터를 '요약' 하기# 공모전명과 공모전 소개를 요약하여 '요약' 컬럼 생성def make_new_summary(text1, text2): while True: try: # OpenAI GPT-3.5-turbo 모델을 사용하여 요약 생성 completion = openai.ChatCompletion.create( model="gpt-3.5-turbo", # ..
2025.02.28 -
[머신러닝] 데이터가 너무 한쪽으로 치우쳐있는 문제 해결하기 - bin/로그 변환/이상치 제거/Box-Cox 변환
bin이란?bin은 히스토그램(histogram)에서 데이터를 나누는 구간의 개수를 의미히스토그램은 연속적인 데이터를 특정 범위로 나누어 빈도수를 시각적으로 표현하는 그래프Bin 개수(구간 수)가 적으면?너무 뭉뚱그려져서 데이터의 세부적인 분포를 확인하기 어려움Bin 개수(구간 수)가 많으면?너무 세분화되어서 노이즈(noise)가 많아 보일 수 있음📌 bin이 많을 때 노이즈가 증가하는 이유- 과도한 세분화(over-segmentation) - 데이터를 작은 구간으로 너무 많이 나누면, 각 bin에 포함된 샘플 개수가 적어짐. - 샘플 개수가 적으면 작은 변동(랜덤한 노이즈)도 강조되어 패턴이 아닌 우연한 변동(random fluctuation)이 더 도드라져 보임.- 데이터의 변동성이 커 보임 ..
2025.02.28 -
[머신러닝] 회귀 모델 - Linear Regression(선형 회귀)/Bagging Regressor(배깅 회귀)/Boosting Regressor(부스팅 회귀)
카테고리를 예측하면 → 분류 (Classification),숫자 값을 예측하면 → 회귀 (Regression),분류는 특정 클래스(이산적인 값),회귀는 선형적인 변화(연속적인 값) 예측에 사용분류(Classification)정해진 카테고리(클래스) 중 하나를 예측하는 문제 -> 즉, "어떤 그룹에 속하는가?" 를 예측하는 것출력값(Y)이 연속적이지 않고, 특정 클래스 중 하나로 결정됨예측 결과는 0, 1 또는 다중 클래스(예: 개, 고양이, 토끼) 같은 이산값(Discrete Value) 예제 1 : 이메일 스팸 분류입력(X): 이메일의 단어 개수, 링크 포함 여부, 광고성 문구 포함 여부출력(Y): "스팸(1)" 또는 "정상 메일(0)"예제 2 : 암 진단(양성 vs. 악성)입력(X): 종양 크기, 세..
2025.02.28