Page 7 - 인공지능 수학 교과서
P. 7

『인공지능 수학』 교과서는...
                             •네 개의 단원으로 구성되어 있습니다.
                             • 각 단원은 대단원 도입   중단원 도입   소단원 생각 열기   본문 전개: 쉽고 간결한 본문 - 예제 /문제/생각해
                               보기 - 인공지능 이야기 - 스스로 정리하기 - 공학적 도구 탐구 활동   대단원 마무리 순으로 전개됩니다.



                                                                                             예측 모델과 분류 모델
                                           인공지능 이야기        5   ▶ a의 값은 [그림 Ⅳ - 1]의   아래로 볼록한 포물선이므로 손실함수 E(a)의 최솟값은 E{;5^;}=;5!;이다.  인공지능  인공지능은 학습을 통해 입력값에 대응하는 출력값을 곧바로 예측할 수도 있고, 또는 입력값이 어느 범주
                                                                   따라서 손실함수 y=E(a)의 그래프는 [그림 Ⅳ -1]과 같이 꼭짓점이 {;5^;, ;5!;}이고,
                                                                                         이야기
                                                               손실함수  E(a)에서는
                                                               정의역의 원소이다.

                                                               또한 [그림 Ⅳ-2]의 예
                                                               측 모델 f(x)=ax에서
                                                                                           이 두 가지 예측 상황의 차이에 대해 알아보자.
                                                               는 매개변수이면서 직선  이때, 손실함수 E(a)가 최소가 되도록 하는 매개변수 a의 값은 a=;5^;이므로 최적의   에 속하는지 예측할 수도 있다.
                                                               의 기울기를 의미한다.  예측 모델은 f(x)=;5^;  x 가 된다.
                                                                                             y 소모  y=f(x)  y  ▲
                                                                   [그림 Ⅳ -2]에서 함수 f(x)=ax의 매개변수 a의 값을 다양하게 적용한 추세선을 확
               인공지능 관련 궁금한 이야기를 꼭 필요한 곳에 배치                        인할 수 있다. 이때 자료의 경향성을 가장 잘 나타내는 추세선의 식은 y=;5^;  x 이다.    전력량  ▲ 고양이 ▲ ▲
                                                                                                        ▲
                                                                                                       ▲ ▲  ▲  ■
                                                                              y=:Á5ª:x y=:Á5ª:x         ■  ■ ■ ■
                                                                               y=2x y=2x               ■  ■ ■  ■  개
                                                                           y
                                                                                y=;5*;x y=;5*;x
                                                                            y
               하여 궁금증은 그때그때 해결하도록 하였습니다.                            11  E(a) E(a)=:Á2°:{a-;5^;}2`+;5!;  y=;5;x y=;5;x ^        [그림 Ⅳ-3]  예측 모델 직선 y=f(x)  x  [그림 Ⅳ-4]  개, 고양이 분류 모델  x
                                                                                               스마트폰 사용 시간
                                                                                             O
                                                                                 ^
                                                                           5
                                                                            5
                                                                                y=x
                                                                                           [그림 Ⅳ-3]은 스마트폰 사용 시간에 따른 소모 전력량 값을 예측하는 모델이다. 이렇게 수로 표현되는
                                                                                 y=;5$;x
                                                                           3  3  y=;5#;x  값을 예측하는 모델을 예측 모델이라고 부른다.
                                                                                 y=;5@;x   예측 모델은 입력값을 이용하여 결괏값을 예측하고, 이 결괏값을 모델의 출력으로 바로 사용한다. 즉
                                                                           1              예측 모델의 오차는 출력값과 실젯값을 이용하여 곧바로 구할 수 있다. 이 경우 우리가 배운 바와 같이 손실
                                                                    1       1   y=;5!;x
                                                                    5                     함수는 오차의 제곱의 평균으로 정의하여 사용한다.
                                                                    O  2  4  6  8  2  12 a  O  O  1  1 2  2 3  3 4  x y=0 x y=0  [그림 Ⅳ-4]는 입력 이미지가 개 범주에 속하는지, 혹은 고양이 범주에 속하는지 구분하는 사례이다.
                                                                                 4
                                                                     5  5  5  5  5
                                                                                           이렇게 입력을 특정 범주로 구분하는 모델을 분류 모델이라고 한다.
                                                                     [그림 Ⅳ-1]  손실함수 y=E(a)  [그림 Ⅳ-2]  예측 모델  f(x)=ax
                                                                                           분류 모델은 입력값을 이용하여 결괏값을 계산한 후 이 결괏값이 어느 범주에 속하는지 최종 결정하는 과
                                                                                          정을 한 번 더 수행한다. 이를 위해 여러 가지 활성화 함수를 사용한다.
                                                                    예제 2                   분류 모델에서는 예측 모델에서 사용한 손실함수를 바로 사용할 수 없다. 예측 모델은 예측값과 실젯값이
                                                                                          수로 표현되기 때문에 오차를 곧바로 계산할 수 있지만, 분류 모델은 예측값과 실젯값이 범주로 표현되므로
                                                                    오른쪽 표는 세 차례의 실험에서 인공지능 로봇이  x 시  x(시간)  1  1  2
                                                                    간 동안 이동한 거리 y  km  를 측정한 자료이다. 예측 모델   오차를 계산하기 위해서는 손실함수를 따로 정의한다.
                                                                    f(x)=ax  의 손실함수가 최소일 때, 매개변수 a의 값을 구  y(km)  1  2  3  이 손실함수를 이용하면 예측값과 실젯값이 같을 확률이 높을수록 오차가 0에 가까운 값이 나오고, 같을
                                                                    하시오.                  확률이 낮을수록 오차가 1에 가까운 값이 나온다. 이는 오차가 발생할 때 손실이 크고, 오차가 줄어들수록
                                                                                          손실이 줄어드는 일반적인 손실함수의 개념과 정확히 일치하는 것을 알 수 있다.
                                                                    풀이
                                                                    손실함수를 식으로 나타내면
                                                                             ¡
                                                                             ¢
                                                                    E(a)=;3!;  {(a-1)^2+(a-2)^2+(2a-3)^2}=2a^2-6a+:3:=2{a-;2#;} ^2 +;6!;
                                                                    손실함수가 최소가 되도록 하는 매개변수 a의 값은 a= ;2#; 이다.
                                                                                  답    ;2#;
                       문제 3     오른쪽 그림은 어느 아이스크림 가게의 20일   판매량  300  y=8.2096x-46.41  다음은 어느 기업의 근무 연수와 평균 월급을 조사하여 나타낸 산점도이다. 이 기업  스스로     손실함수란 무엇인가?
                                 250
                         동안 낮 최고 기온과 하루 아이스크림 판매  의 근무 연수에 따른 평균 월급 사이의 경향성을 살펴보자.
                                 ( 개  200                                                정리하기    손실함수를 최소가 되게 하는 매개변수의 값이 갖는 의미는 무엇인가?
                                 150                                문제 2     어떤 자료에 대한 손실함수가 E(a)=a^2+pa+q이고, 최적의 예측 모델이
                         량을 조사하여 나타낸 산점도와 추세선이  )       (단위: 만 원)
                                 100                                 f(x)=2x일 때, p의 값을 구하시오.(단, p, q는 상수이다.)
                         다. 다음 물음에 답하시오.  50   근무 연수  1  2  3  4  5  6
                                 0  5  10  15 20 25 30 35  40
                       (1) 낮 최고 기온이 15℃라고 할 때, 이 가게의 아이  낮 최고 기온(℃)  평균 월급  132  140  151  168  182  214  116  Ⅳ.  최적화  1. 최적화와 의사 결정  117
                        스크림 판매량을 예측하시오.
                                               근무 연수  7  8  9  10  11  12
                       (2) 낮 최고 기온이 36℃라고 할 때, 이 가게의 아이스크림 판매량을 예측하시오.
                                               평균 월급  258  313  380  423  630  997
                                                    근무 연수에 따른 평균 월급
                  엥겔 지수  문제 4     오른쪽 그림은 어느 나라의 20가구의 월   엥겔  0.8  월 소득과 엥겔 지수  인공지능수학 2차제출용.indb   116  2021-05-10   오전 8:22:48인공지능수학 2차제출용.indb   117  2021-05-10   오전 8:22:49
                  엥겔 지수는 총 가계 지출액   소득과 엥겔 지수를 조사하여 나타낸 산점    지수  0.7 0.6  평균
                  중에서 식료품비가 차지하는              1,200
                                 0.5
                                                     Û
                                                   Ü
                  비율을 나타내는 지수이다.  도와 추세선이다. 다음 물음에 답하시오.  0.4    월급 1,000  y=1.7179x`-23.078x`+106.34x+20.182
                                 0.3                y=10.422x`-74.9x+254.68
                                                     Û
                                 0.2
                       (1) 월 소득이 180만 원인 가구의 엥겔 지수를 예측  0.1  y=-0.0013x+0.9615  ( 만  800  y=60.58x-61.439  6  스스로 정리하기
                        하시오.     0  100  200  300 400 500 600 700    원  600
                                     월 소득(만 원)  )  400
                       (2) 월 소득이 600만 원인 가구의 엥겔 지수를 예측  200
                        하시오.                  0
                                                2  4  6  8  10  12  14
                                                         근무 연수(년)
                                                   근무 연수에 따른 평균 월급 사이의 추세선  소단원 학습을 마무리하며 꼭 알아 두어야 할 핵심
                        자료의 경향성은 직선으로만 나타낼 수 있을까?
                                            산점도를 살펴볼 때 발견할 수 있는 것은 근무 연수가 길수록 평균 월급이 많아지는
                       산점도의 경향성을 나타내는 추세선은 직선 외에도 다양한 형태로 나타낼 수 있다.
                                            데 근무 연수가 길면 길수록 1년 단위의 평균 월급의 증가폭이 가파르게 커지고 있음
                       그림은 한국 남자의 연령에 따른 평균 앉은키를 조사하여 나이를 x, 평균 앉은키를   어떤 형태의 추세선을
                                            을 알 수 있다.        이용해야 합리적인 예측을   개념을 스스로 점검합니다.
                      y라고 하여 나타낸 산점도이다. 이 산점도를 분석하면 30~34세까지 평균 앉은키가 증  이와 같이 여러 가지 형태의 추세선을 통해 자료의 경향성을 분석할 수 있으며 다양  할 수 있는지는
                      가하다가 그 이후부터의 구간별 평균 앉은키는 점점 감소한다. 이와 같은 산점도는 추  이 단원에서 다루지
                                                              않기로 해요.
                                            하게 예측할 수 있다. 근무 연수에 따른 평균 월급의 추세선에서 근무 연수가 10년, 11
                      세선을 직선으로 표현하는 것이 불가능하므로 경향성을 나타낼 때는 곡선을 사용해야
                                            년, 12년일 때의 평균 월급의 증가 속도가 가파른 것을 볼 때, 추세선이 일차함수의 그
                      한다. 이와 같이 자료의 경향성에 따른 추세선은 다양하게 나타난다.
                                            래프일 때보다 이차함수, 삼차함수의 그래프일 때 더욱 합리적인 예측을 할 수 있다.
                        93.5
                        93.0
                        92.5
                      평균  92.0
                      앉은키 91.5 91.0
                      (cm)
                        90.5
                        90.0
                        89.5                       자료가 경향성을 갖는다는 것은 무슨 뜻인가?
                        89.0
                         ≈                   스스로
                        0  ≈ 15~19  20~24  25~29  30~34  35~39  40~49  50~59  60~69  70 이상  정리하기    추세선이란 무엇인가?
                                     나이(세)
                                                   추세선이 항상 직선이 아닌 이유는 무엇인가?
                             한국 남자의 나이에 따른 평균 앉은키를 나타내는 산점도
                  102  Ⅲ.  분류와 예측                            2. 경향성과 예측 도구 103                             문제 해결
                                                              공학적
                                                                                                           추론
                                                                                                           창의 융합
                                                                  자료의 경향성을 파악하여 예측하기                       의사소통
                                                                활 동
                                                              탐 구                                          정보 처리
                                                                                                           태도 및 실천
                인공지능수학 2차제출용.indb   102  2021-05-25   오후 3:03:13인공지능수학 2차제출용.indb   103  공학적 도구를 이용하여 추세선을 그리고, 두 자료의 경향성을 파악하여 예측해 보자.  3   마우스 오른쪽 버튼을 눌러 나온 메뉴 중 ➏  x축과 y축의 비율을 ➐  1:20으로 변경하면
                                                               공학적 도구를 이용하여 추세선을 그리고, 두 자료의 경향성을 파악하여 예측해 보자.
                                                                2021-05-25   오후 3:03:13
                                                                                             ➑ 산점도가 표시된다.
                                                               준비하기  두 자료의 경향성을 분석하기 위한 기본 자료 수집하기  1 : 50  200
                                                                                         x축과 y축의 레이블은  기하창  180 ➑
                                                                                (단위: 억 원)  기하창 메뉴에서   좌표축  ➐  1 : 20  160
                                                                   A  광고비 1  매출 30.5  BA  광고비 4.2  매출 70.2  BA  광고비 9  매출 120  B  변경이 가능해요.  ➏ x축 : y축 격자 구성단계 내비게이션 바  1 : 10 1 : 5 1 : 2  140 120 100
                                      공학적 도구 탐구 활동         7        1.5 3 3  40.7 50.6 60.4  5 6 7  80.6 90.2 100  10 13 14  125 128 130  크게보기 / 작게보기  1 : 1 2 : 1 5 : 1 10 : 1  80 60 40 20
                                                                                              모든 대상 보이기
                                                                                              표준 보기
                                                                                              기하창 ...
                                                                          A 기업의 광고비에 따른 매출의 변화       0  1  2 3  4 5  6 7  8 9 1011  1213 1415
                                                                                            4  ➒  적합선을 선택하고, 산점도의 두 점을 클릭하면 추세선이 완성된다. ㉠과 ㉡을 연결하
                                                               따라하기  자료를 표로 나타내고 추세선으로 그려 예측하기  여 나온 추세선의 방정식은 y=9.92x+25.82이다.
               다양한 공학적 도구를 활용하여 탐구 활동을 할 수                    지오지브라  1  교육용 프로그램을 실행하여 오른쪽 상단의 ➊ 상세 메뉴를 클릭하고 ➋  보기 >   200
                                                              그래프, 기하 등을 만들
                                                              수 있는 무료 교육용 수학   ➌  스프레드시트를 선택한다. 열린 시트에 위의 자료를 입력한다.  ㉠과 ㉡이 아닌  수직선  180 160
                                                              프로그램으로  추세선을               다른 점을 연결한다면   평행선  140  ㉡
                                                              그리고 자료의 경향성을     ➊         추세선의 방정식은   수직 이등분선  120 100
               있도록 실제 활동 예시를 제시하였습니다.                         예측하는 데 적합하다.                     각의 이등분선  80 60 40  ㉠  적합선: y=9.92x+25.82
                                                                                         다르게 나와요.
                                                                                               접선
                                                                                               극선 또는 지름
                                                                              ➋               ➒  적합선  20
                                                                                               자취그리기  0  1  2 3  4 5  6 7  8 9 10 11  12 13 14 15
                                                                                            5  4번에서 생성한 추세선을 이용하여 광고비를 예측한다.
                                                                               ➌
                                                                                               광고비가 20억 원이면 y=9.92time20+25.82=224.22로 매출이 224억 원 정도임을 예측
                                                                                             할 수 있다.
                                                                   2  입력한 값의 영역을 선택한 다음 마우스 오른쪽 버튼을 눌러 나오는 메뉴 중 ➍  만들기 >
                                                                   ➎  점의 리스트를 선택한다.
                                                                                         스스로하기  새로운 두 자료를 수집하여 경향성 파악하기
                                                                                            1   수집한 자료를 교육용 프로그램에 정리해 보자.
                                                                                            2 입력한 자료를 바탕으로 프로그램을 이용하여 추세선을 그려 보고, 예측한 결과를
                                                                                             적어 보자.
                                                                            ➍
                                                                               ➎
                                                              정답 및 해설 152 150쪽 쪽
                     대단원  마무리
                                             발전 문제
                  배운 내용  이 단원에서 배운 핵심 개념을 단계별로 정리해 봅시다.       104  Ⅲ.  분류와 예측                             2. 경향성과 예측  105
                  정리 하 기                      09  문장 1, 2, 3의 밑줄 친 주요 단어를 이용하여 다음 물음에 답하시오.
                    01  자카드 유사도의 값이     에 가까울수록 유사한 문장으로,     에 가까  문제
                                             해결   문장 1  코사인 유사도로 분류할 수 있다.
                      울수록 유사하지 않은 문장으로 각각 판단한다.   문장 2  자카드 유사도는 집합을 이용한 분류이다.
                                                  문장 3  텍스트 문서는 유사도로 분류할 수 있다.  003 인공지능수학 본문 3-2단원 2차 01.indd   104  2021-05-21   오후 3:31:52003 인공지능수학 본문 3-2단원 2차 01.indd   105  2021-05-21   오후 3:31:53
                    02  코사인 유사도의 값이     에 가까울수록 유사한 문장으로,     에 가까  (1)   집합을 이용한 자카드 유사도를 구하여 세 문장 중 가장 유사한 두 문장을 고르시오.
                      울수록 유사하지 않은 문장으로 각각 판단한다.(단, 벡터의 모든 성분은 양수이다.)
                                                (2)    벡터를 이용한 코사인 유사도를 구하여 세 문장 중 가장 유사한 두 문장을 고르시오.
                    03  해밍 거리가     에 가까울수록 유사한 문장으로,     에서 멀수
                      록 유사하지 않은 문장으로 각각 판단한다.  서술형
                                              10  고객 40명의 성별과 제품 A의 선호도를 조사하여 정리한 것이다. 새로운 고객이
                    04      은/는 인간의 뇌의 신경망을 모방한 것이다.  의사  남자일 때, 이 고객이 제품 A를 선호하는 고객일지, 선호하지 않는 고객일지 예측하
                                             소통
                                                고 그 이유를 설명하시오.
                    05  수학의     은/는 인공지능이 가능성 또는 확실성 정도를 수치화하여 예측  구분  선호  비선호  계  8  대단원 마무리
                                                 남자
                      할 때 이용된다.                     12  4  16
                                                 여자  18  6  24
                    06    은/는 산점도에 있는 모든 x에 대해 예측값 f(x)와 측정값 y 사이의    계  30  10  40
                      차이들을 최소화하는 직선이다.
                                              서술형                     각 대단원 학습을 마치며 다양한 방식을 활용하여
                                              11  어느 매장의 영업 60일간의 누적 방문 고객 수를 매일 조사하여 구해 보니 영업일 x
                   기본 문제                     정보
                                             처리   와 누적 방문 고객 수 y에 대한 추세선의 방정식이 y=18.5x+3.24이었다. 이 추세선
                    07  어느 쇼핑몰의 4개 제품의 판매량은 총 80개이다. 어떤 고객이 4개의 제품 중 하나를 구  을 이용하여 영업 90일 때의 누적 방문 고객 수를 예측하시오.
                   추론   매하려고 할 때, 어떤 제품을 구매할 것으로 예측할 수 있는지 상대도수와 확률을 이용  대단원 마무리 학습을 진행하고 스스로 평가합니다.
                      하여 답하시오.
                       제품 종류   A   B   C   D  스스로 평가하기
                       판매량   16   12   22   ➊ 이 단원을 배우면서 가장 흥미로운 점과 어려운 점을 써 봅시다.
                       상대도수
                                            ➋ 이 단원에서 배운 내용을 생각하면서 자신의 성취 수준을 스스로 평가해 봅시다.   만족,     보통,     미흡
                    08  세 행렬 A, B, C 중 해밍 거리가 가장 가까운 두 행렬을 구하시오.  1  인공지능을 이용하여 텍스트와 이미지를 분류하는 수학적 방법을 이해한다.
                   문제  0 0 0  0 1 1  1 1 0   2  자료를 분석하여 사건이 일어날 확률을 구하고 예측에 이용할 수 있다.
                   해결                        3  자료의 경향성을 추세선으로 나타내고, 예측에 이용할 수 있다.
                            f
                         f
                      A= 1 0 1p    B= 1 1 0p    C= 0 1 0p
                       f
                       0 1 1  1 0 1  0 0 1            ※ 스스로 평가할 때 ‘미흡’이면 3단원 본문을 보고 더 공부해 보세요.
                  106  Ⅲ.  분류와 예측                            대단원 마무리  107
                003 인공지능수학 본문 3-2단원 2차 01.indd   106  2021-05-21   오후 3:32:14003 인공지능수학 본문 3-2단원 2차 01.indd   107  2021-05-21   오후 3:32:15
   2   3   4   5   6   7   8   9   10   11   12