본문 바로가기

분류 전체보기79

[AI] Perceptron 퍼셉트론은 다수의 신호를 입력 받아 하나의 신호를 출력합니다. 입력에 상수(가중치)를 곱해 전부 더한 값이 특정 값보다 크면 1, 아니면 0을 출력합니다. 여기서 특정 값은 임계값이라고 하며, theta로 나타냅니다. 위 내용을 아래로 나타내면 다음과 같습니다. 퍼셉트론은 입력 신호 각각에 고유한 가중치를 부여합니다. 가중치가 클수록 해당 신호가 그만큼 더 중요함을 나타냅니다. 그럼 퍼셉트론을 활용한 간단한 문제를 살펴보겠습니다. 위에서 퍼셉트론은 다수의 입력을 받아 하나의 신호를 출력한다고 했죠? AND 게이트를 예로 들면 2개 이상의 입력을 받아 하나의 출력값을 결정해줍니다. 이를 위해 할 일은 진리표대로 작동하는 x1,x2,theta의 값을 정하는 것입니다. 다음과 같은 그림을 파이썬으로 구현해보겠.. 2022. 11. 7.
[데이터베이스] 정규화 정규화란? 함수적 종속성 등과 같은 이론에 근거하여 관계형 데이터베이스 테이블의 삽입, 삭제, 갱신으로 인한 이상 현상 발생을 최소화하기 위해 좀 더 작은 단위의 테이블로 설계하는 과정. 즉, 데이터 모델을 정규형에 맞도록 고치는 과정입니다. 여기서 정규형은 정규화 결과에 의해 도출된 데이터 모델이 갖춰야 할 특성을 말합니다. 또한 함수적 종속성이란 테이블의 특정 컬럼 A를 알면 다른 컬럼 B를 알 수 있을 때, B는 A에 함수적 종속성이 있다고 합니다. 정규화를 하게 되면 얻는 장점으로는, 상호 종속성이 강한 데이터 요소들을 분리, 독립된 개념(엔티티,테이블)로 정의하게 됨에 따라 유연성이 극대화됩니다. 개념이 조금 더 세분화됩니다 재활용 가능성이 더 높아집니다 중복이 최소화됩니다 정규화에는 제 1정규.. 2022. 10. 19.
[AI] K-Nearest Neighbors 직접 구현 K-Nearest Neighbor은 대표적인 분류 알고리즘입니다. 유사한 속성을 가진 데이터는 유사한 그룹에 속한다는 아이디어로 사용합니다. 위의 그림을 보면 모든 데이터는 1,2,3이라는 각각 다른 색상으로 분류되어있다. 하지만 새로 입력한 저 빨간 점에 대한 분류는 어떻게 하는 것일까? 이에 KNN이라는 알고리즘을 도입하게 됐는데, 간단히 요점을 나열하자면 유사한 데이터들끼리의 거리는 비교적 가깝다. 분류를 알 수 없는 새로운 데이터는 가장 가까운 이웃 k개의 분류를 확인하여 vote 한다 k의 개수가 너무 작으면 과대적합이 일어날 수 있다 k의 개수가 너무 많으면 과소적합이 일어날 수 있다 필요한 라이브러리 불러오기 import numpy as np import matplotlib.pyplot as.. 2022. 10. 19.
[데이터베이스] 데이터 모델 건축물을 설계하기 위해서는 설계도면이 필요하다. 그렇다면 데이터베이스를 설계하기 위해서는 무엇이 필요할까? 우리는 이 데이터베이스(건축물)를 만들기 위해 데이터모델(설계도면)을 필요로한다. 지금부터 데이터모델에 대해 알아보자 데이터모델 데이터 모델은 현실 세계를 데이터베이스로 구축할 수 있도록 추상화 한 것입니다. 다른 말로 익숙된 표기법에 의해 명확하고 단순하게 표현한 것입니다. 데이터 모델링 데이터베이스를 구축하기 위한 분석/설계의 과정으로, 개념적 데이터 모델링, 논리적 데이터 모델링, 물리적 데이터 모델링으로 총 3단계로 나뉩니다. 개념적 데이터 모델링 핵심 엔터티와 핵심 엔터티들 간의 관계를 정의하는 과정으로, 추상화 수준이 높고 업무 중심적임 논리적 데이터 모델링 모든 업무 요구를 충족하기 위.. 2022. 10. 14.