돈의 정석: 정박사의 재테크 연구소
로또 프로그램 제작 (1) 본문
안녕하세요...정박사입니다.
저는 AI공부를 많이 했기 때문에 사실 프로그램 하나 짜는건 아주 금방하고 있습니다.
로또 프로그램도 2시간정도 밖에 안걸렸으니깐요..머 물론 AI가 잘 짜주기 때문에 누구나 할 수 있어요..
문제는 어떤 알고리즘으로 짤지가 중요하거든요.
로또 번호는 랜덤 변수이기 때문에 사실 학습이라는게 의미가 없습니다.
말그대로 규칙이나 패턴이 없기 때문에 과거의 데이터로 미래를 예측하는게 사실상 불가능하다는 얘기입니다.
저는 우리나라 로또가 왜이렇게 당첨자가 많은가 의심을 했어요..
1등당첨 확률이 1/800만 이기 때문에 사실 거의 안되야 하는게 맞는데, 매번 최소 5명 이상이 되는거 보니 어이가 없더라구요.. 근데 뉴스를 보니 한주 로또 구매량이 1억장이라고 하더라구요 ㅎㅎㅎ 웃음만 나왔습니다. 이러니까 당첨자가 많구나..그래서 다시좀 짜볼려고 해요..
우선 지금까지 짠거에 대해 말씀드릴께요..
1. DATA확보
DATA는 동행복권 사이트에 가면 엑셀로 다운 받을 수 있습니다.
오른쪽 아래에 회차를 1회서부터 아래 엑셀 다운로드 하시면 됩니다.
2. DATA전처리.
저는 우선 데이터를 깔끔하게 처리합니다. 이 작업은 컴퓨터가 학습하기 좋게 만든다는 얘기에요..
아래처럼 엑셀에더 필요없는 거 다 지우고, 6개의 번호 그리고 각 등수의 당첨금액만 정리했습니다.
1 | 10 | 23 | 29 | 33 | 37 | 40 | 16 | 2E+09 | 1.44E+08 | 5140500 | 113400 | 10000 |
2 | 9 | 13 | 21 | 25 | 32 | 42 | 2 | 2E+09 | 94866800 | 1842000 | 100800 | 10000 |
3 | 11 | 16 | 19 | 21 | 27 | 31 | 30 | 2E+09 | 0 | 1174100 | 54900 | 10000 |
4 | 14 | 27 | 30 | 31 | 40 | 42 | 2 | 2E+09 | 2.11E+08 | 7282400 | 152100 | 10000 |
5 | 16 | 24 | 29 | 40 | 41 | 42 | 3 | 2E+09 | 0 | 6033800 | 166500 | 10000 |
6 | 14 | 15 | 26 | 27 | 40 | 42 | 34 | 6.57E+09 | 1.96E+08 | 4267300 | 87600 | 10000 |
7 | 2 | 9 | 16 | 25 | 26 | 40 | 42 | 6.57E+09 | 48165000 | 1605500 | 65500 | 10000 |
8 | 8 | 19 | 25 | 34 | 37 | 39 | 9 | 6.57E+09 | 1.32E+08 | 2268100 | 110500 | 10000 |
9 | 2 | 4 | 16 | 17 | 36 | 39 | 14 | 6.57E+09 | 7.69E+08 | 8743800 | 260000 | 10000 |
10 | 9 | 25 | 30 | 33 | 41 | 44 | 6 | 6.43E+09 | 40813400 | 856400 | 27300 | 10000 |
11 | 1 | 7 | 36 | 37 | 41 | 42 | 14 | 4.78E+09 | 3.62E+08 | 9307100 | 206800 | 10000 |
12 | 2 | 11 | 21 | 25 | 39 | 45 | 44 | 1.35E+09 | 99914400 | 1417500 | 70200 | 10000 |
그 다음 이 파일을 CSV파일로 저장합니다. 저는 VS CODE를 활용해서 했습니다.
3. 학습 코드 짜기.
저는 학습자체가 간단하다고 판단도 했고, 제 데스크 탑에 GPU가 따로 없기 때문에 GOOGLE에서 제공하는 COLAB을 이용했습니다. 대학원생때부터 썼던거라서 저한테는 익숙하긴 한데, 초보자 분들을 따로 학습을 해보시는게 좋습니다.
코드가 필요하신 분들은 연락주시면 다 드릴께요..
저는 우선 기존의 학습코드를 LSTM 방식, 단순 확률 통계 방식, 세번째는 그동안 가장 많이 나온 숫자를 고른 후
그 숫자와 가장 같이 나온 빈도가 많은 숫자를 고르고, 또 그 숫자와 빈도가 많이 나온 숫자를 고르는 방식의 알고리즘을 작성했습니다.
실제 그 이후에 각각의 방법에 맞게 예상 번호를 10개씩 추출했습니다.
그리되면 실제로는 30개의 숫자가 나오게 되겠죠..
지금까지의 결과는 1~2개 정도만 맞추고 있습니다. 이대로는 안되겠죠?
그래서 또 알고리즘의 변화가 필요한 거 같아요...
다음 블로그에서 이어갈께요..
'재테크' 카테고리의 다른 글
25년 2월 7일 국내 시장 시황정리!! (1) | 2025.02.09 |
---|---|
📢 2025년 2월 8일 미국 증시 마감 정리 – S&P 500, 5000 돌파할까? (0) | 2025.02.09 |
40대 직장인의 부업 이야기(2)..솔직한 이야기입니다. (3) | 2025.02.09 |
40대 직장인의 부업 이야기..솔직한 이야기입니다. (0) | 2025.02.09 |
💰 "쥐꼬리 이자 받느니…" 한 달 새 5조 원 빠져나간 예·적금, 돈은 어디로 갔을까? (0) | 2025.02.08 |