전체 글(86)
-
[게시판 프로젝트] repository, JPAConfig 생성
DB를 생성하고, 도메인 클래스 작성 완료 후 스프링 부트를 실행하면, 테이블이 생성됩니다.생성된 DB의 테이블 및 DDL은 오른쪽 DB 아이콘을 통해서 확인할 수 있습니다.JPA explorer를 통해서 도메인 클래스에 대한 Repository를 DB로 부터 생성해 보겠습니다.왼쪽 사이드바 JPA explorer 아이콘을 클릭하고, + 아이콘을 클릭 - JPA Entities from DB를 클릭합니다.ArticleCommentRepositoryArticleRepository
2024.08.15 -
[게시판 프로젝트] IntelliJ spring boot DB 접근 설정하기 - MySQL
DB-engines : 가장 인기있는 DBMS의 순위를 볼 수 있는 사이트오른쪽 DB아이콘을 클릭하고, + 아이콘을 클릭한 후 지원하는 DB중 MYSQL을 선택한다.데이터 소스 및 드라이버를 설정한다.[주의] 누락된 드라이버 다운로드 시Settings - 빌드,실행,배포 - 빌드도구 - Gradel - 종속성에 대한 외부 어노테이션 다운로드는 항상 꺼두자console 창 : DB 생성 create 문을 통해서 DB를 생성한다.root 사용자가 아닌 사용자를 새로 생성해 준 뒤, 쿼리문을 통해 사용자가 잘 생성되었는지 확인한다.사용자의 권한을 확인하고, 사용자에게 새로 권한을 부여합니다.build-gradle 의존성 추가application.yml 설정
2024.08.15 -
[게시판 프로젝트] 도메인 설계하기 - Java 클래스로 도메인 표현하기
도메인 ERD 다이어그램을 토대로,Java 클래스에 도메인을 표현한다.Article Classlombok 설정@Getter // class 레벨로 Setter를 걸지 않음@Table(indexes = {})//사이즈가 너무 큰 본문은 보통 인덱스를 걸지 않음 - ElasticSearch와 같은 검색엔진의 도움을 받음@EntityListeners(AuditingEntityListener.class)//auditing 기능을 동작하게 함API 설계했던 토대로 변수를 작성@ToString.Exclude/*ToString includes lazy loaded fields and/or associations.This can cause performance and memory consumption issues-> ..
2024.08.15 -
[게시판 프로젝트] 도메인 설계하기 - github과 draw.io 연동하여, ERD 그리기
게시판 서비스를 만들기 위한 도메인을 설계해보자 ERD 다이어그램을 깃허브와 연동하기 위해서, app.diagrams.net이라는 url를 입력한다새로운 다이어그램 만들기를 선택하고, 파일명과 확장자(svg)를 변경하고 ERD 다이어그램을 선택한다. 깃헙과 연동되어있기 때문에, 깃헙의 해당 repo를 선택하고, 브랜치를 선택한다.이때, 깃에 먼저 브랜치를 생성하고 push 해주지 않으면 브랜치가 뜨지 않기 때문에 먼저 push 후 폴더를 선택해 주어야한다. 본격적으로 ERD를 작성한다.ERD를 작성할 때, 명과 타입그리고 타입의 크기까지 모두 작성해 주는 것이 좋으며, NOT NULL은 Bold처리한다.도메인과 직접적으로 연관되는 것을 작성한다.도메인과 직접적으로 연관이 없으며 모든 엔티티에 속할 메타데..
2024.08.15 -
[데이터 사이언스/개념] 표준화의 장점 및 데이터 scale 차이에 따른 영향
표준화를 통해 데이터의 스케일 차이를 줄임으로써모델이 각 특성에 균등하게 학습할 수 있도록 도와줍니다.이는 특히 경사 하강법을 사용하는 모델에서학습 속도를 높이고 성능을 향상시키는 데 중요한 역할을 합니다.표준화의 장점학습 속도 향상많은 머신 러닝 알고리즘은 데이터의 크기와 분포에 민감합니다. 표준화된 데이터는 모델이 더 빠르게 수렴할 수 있도록 도와줍니다. 특히 경사 하강법을 사용하는 알고리즘에서 학습 속도를 크게 향상시킬 수 있습니다.스케일 차이 문제 해결원본 데이터의 특성들이 매우 다른 스케일을 가질 경우, 스케일이 큰 특성들이 모델 학습에 더 큰 영향을 미치게 됩니다. 표준화는 모든 특성들을 동일한 스케일로 변환하여, 각각의 특성이 동일한 중요도로 고려되게 합니다.모델 성능 향상표준화는 특히 거리..
2024.08.15 -
[데이터 사이언스/개념/문법] pipeline이란?
Pipeline은 여러 변환기를 순차적으로 적용할 수 있게 해주는 유용한 도구입니다.각 변환기를 파이프라인의 하나의 "단계(step)"로 추가합니다.이러한 각 단계는 고유의 이름과 변환기로 구성됩니다. num_transformer = Pipeline(steps=[ ('imputer', SimpleImputer(strategy='mean')), ('scaler', StandardScaler())]) 수치형 데이터를 전처리하는 파이프라인을 정의이 파이프라인에는 두 가지 주요 단계: 결측치 대체와 표준화SimpleImputer & StandardScalerSimpleImputer(strategy='mean'):결측치를 평균값으로 대체합니다.각 열에 대해 결측치가 있을 경우, 해당 열의 평균값으로 결측치를 대체..
2024.08.15