본문 바로가기
e-Logbook

풋볼데이 카드확률은 과연 조작되고 있는가?

by Thdnice 2014. 1. 3.
반응형


들어가기에 앞서


  본문은 다소 수학적인 수식과 내용을 포함고 있으나, 사실 중등수준의 수학을 섭렵하였다면 이해하는데 아무런 지장이 없는 내용으로 이루어져있습니다. 최대한 이해하기 쉽게 적으려고 노력하였으나 그럼에도 불구하고 이해하는데 어려움이 있으시다면, 그건 필자가 말을 제대로 설명하는 능력이 부족해서이니 부디 짜증내거나 화내지 마시고, 댓글로 부족한 저를 꾸짖어 주시길 바랍니다. 최대한 불확실성을 배제하려고 하였으나, 게임의  Systematic 한 부분은 사실 확인할 길이 없으니 어느정도 가정이 들어가는 건 어쩔 수 없습니다. 이런 부분은 추후 게시판을 통해 토의/토론을 할 수 있는 건전한 분위기가 형성되었으면 좋겠습니다.






실험목적과 감사의 인사

 일단, 들어가기에 앞서 풋볼데이의 핵심인 카드뽑기에 대해서 한 번 살펴보도록 하죠. 누구나 좋은 카드로 이루어진 단일덱을 뽑고 싶어합니다. 뭐 예를들면 FC바르샤, 레알마드리드, 맨체스터 시티 등이 있겠지요. 2500여장이 넘는 카드중에서 원하는 카드는 20장 내외니 당연히 힘듭니다. 그런데 최근 게시판에 제기된 여러 의문중 하나가, 내가 모으려는 리그(팀)은 안나오게 확률 조정이 되서 아무리 뽑으려고 해봤자 돈만 낭비된다. - 즉 "확률주작설" 이 많이 나오고 있습니다. 뭐 일견 있을 수 있는 일처럼 보이기도 합니다. 그런데 문제는 이를 논리적으로 뒷받침 할 수 있는 근거가 없다는 겁니다. 기껏해야 


"내가 EPL 모으고 있는데, 어떻게 30장 중에서 한장도 EPL카드가 나오지 않을 수 있는가!" 라던가
"세리앙 10장 나올때 라리가 1장 나온다. 이게 말이되는가!" 

라는 식의 빈약한 근거가 있을 뿐입니다. 에초에 리그별 카드가 나올 확률이 균등하다고 (Probability function이 flat)하다고 할 근거도 없을 뿐더러, 심지어 카드가 나올 확률이 균등하다쳐도 저렇게 적은 표본(Statitic)으로는 만족할만한 결론을 이끌 어 낼 수 없습니다. 그래서 풋볼데이의 유저분들과 같이 Open-Project 로 충분한 자료를 수집한다면 나름 어떤 확률 밀도 함수( P(x) : Probability function)을 만들어 낼 수 있지 않을까, 그 확률 분포함수를 알 수 있다면, 이런 조작이 실제로 되고 있는지, 골드카드가 나올 확률을 어떻게 계산할 수 있을지에 대해서 생각해보았고, 나름 대충이지만 객관적인 데이터를 수치분석해놓았으니, 아래의 내용을 읽고 각자 도움이 될 수 있기를 바랍니다. 


특히 자료보내주신 많은 분들께 거듭 감사의 말씀을 드립니다. 

참가해주신 분들의 이름은 거론하지 않겠습니다만 (혹시 원하시면 Special thanks to에 넣어드릴께요 특히 500장이나 한번에 까주신 pjw****님,  그리고 txt파일에 나름 주석을 붙여주셔서 저를 2배 힘들게 해주셨던 권*민님 .. ㅋ)  


자료에 사용된 데이터와 양은 다음과 같습니다.



본인 케릭 : 베티스(라리가)모으는중 1000원 카드 데이터 2420장(날짜별로 정리)

실험용 부케 : EPL모으는중 1000원 카드 데이터 420장 (2014/ 1/ 1)

실험용 부케 : Random모으는중 1000원 카드 데이터 82장 (2014/ 1/ 2) 

지원자1 : 파레셍제르망(리그앙) 모으는중 1000원 카드 데이터 182장 (2014/ 1/2 )

지원자2 : 레버쿠젠(분데스리가) 모으는중  1000원 카드 데이터 182장 (2014/ 1/2 )

지원자3 : 라리가 모으는중 1000원 데이터 500장 (2014 1/ 2)

지원자4 : 레버쿠젠(분데스리가) 모으는중 1000원 카드 데이터 82장 (2014/ 1/ 2)

지원자5 : 분데스리가 모으는중 1000원 카드 데이터 250장 (2014/ 1/ 1)

지원자6 : 세리에 모으는중 1000원 카드 데이터 400장 (2014 /1 / 2)

지원자7 : 라요(라리가) 모으는중 1000원 카드 212장 9000카드 20장 (2014/ 1/ 2)

지원자8 : 라리가 모으는 중 1000원 카드 데이터 82장 ( 2014 /1 /2)


  아무래도 모집을 1월 1일날 해서 그런지 수집된 데이터는 모두 1/1~1/2일날 모여있군요, 패치(점검) 전후로 카드의 확률 통계를 비교해보는 것도 의미있을텐데... 이건 시간나면 차후에 진행해볼 생각입니다. 


  아무튼 지원자분들께 다시한번 감사의 인사를 드립니다.

사용된 소프트웨어 : Root Version   5.34/11   31 October 2013

모든 데이터는 root형식으로 저장되어 있고, Root 프로그램은 프리웨어입니다. 다음의 링크에서 자유롭게 받아 설치하실 수 있습니다. 또한 원하시면 사용된 모든 자료와 plot, data point를 보내드릴 수 있습니다. 다만 카드자료는 저의 것이 아니라 지원자분들의 것이기 때문에 raw자체로 보내드릴 수 없고 histo의 형태로만 보내드릴 수 있음을 양해부탁드립니다.





확률 가중치(Weight)에 대해서

  가끔 나오는 게시판의 내용입니다. 

골드카드가 현재 총 42장 존재하고있고 전체 선수는 2763 명이니

골드카드를 뽑을 확률은

1~6렙을 뽑을 수 있는 천원짜리의 경우는 42/2763 * 100    --> 약 1.52%

3~6렙을 뽑을 수 있는 9천원짜리 경우는  42/1914 *100 --> 약 2.194%


  얼핏 그럴듯해 보입니다. 그런데 여기서 한가지 간과되고 있는 점이 있습니다. 그것은 과연 모든 카드가 나올 확률이 똑같은가? 입니다. 보통 위의 같은 식의 계산은 동전던지기, 혹은 주사위 던지기에서 많이 사용됩니다. 나올수 있는 총 경우의 수를 나누어서 확률을 계산하는 거지요. 그런데 거기에는 동전의 앞뒷면이 나올 확률이 일정하다, 주사위의 모든 면이 나올 확률이 일정하다. 라는 가정이 필요합니다. 그런데 이 게임에서는 과연 모든 카드의 확률이 일정할까요? 


  그렇다면 왜 어떤분들으 2000장을 4000장을 까도 골드카드들을 볼 수 없는걸까요? 왜 허접한 선수는 계속 보이고, 메시나 호날두 같은 네임벨류 높은 선수들은 잘 안나오는 걸까요? 왜 1000원 짜리에는 1~6랩의 선수가 나온다는데, 내가 뽑는 선수는 맨날 2랩 3랩만 나오는걸까요? 


  이를 확인해보는 한가지 쉬운 방법이 선수별 레벨 분포를 확인해보는 겁니다. 

  지금 알려진 선수들의 레벨 분포는 다음과 같습니다.

(출처: 실명공개님의 자료) 


그렇다면 이 자료를를 히스토그램으로 보겠습니다.


  6랩 카드는 2장 뿐이라서 보이지도 않는군요 ㅠㅠ

  이제 이를 아무런 가중치 없이 확률밀도 함수로 변형하겠습니다.(모든 카드가 나올 확률이 동일하다는 가정으로 변환). 확률밀도함수는 쉽게 말해서 어느 구간 부터 어느구간까지를 적분했을 때, 그 구간에서 사건이 일어날 확률을 계산해주는 함수입니다. 즉 모든 구간을 적분하면 1이 나오는 함수입니다. (주로 양자역학에서 쓰이지만, 이런 계산을 할 때 유용합니다.) 이해하기 힘드신분은 아래에 x축 bin이 1이므로 그냥 y값이 확률이라고 보시면 됩니다. 즉 카드별로 가중치(혹은 이해하기 쉽게 희귀도)가 정해져 있지 않다면 카드를 뽑았을 때 나오는 레벨의 분포는 아래의 확률 분포를 따라야 합니다.



  자 그럼, 이번엔 실제로 뽑히는 카드의 분포를 보도록 하지요, 카드를 레벨별로 나누어서 보관하시는 분은 없으실테니(ex 나는 2레벨 카드만 모을꺼야 라던가 나는 3레벨 카드만 모을꺼야), 가지고 있는 레벨에 따라서 레벨이 조작된다는 조작설은 여기선 힘을 잃습니다. 즉 모든 표본을 그냥 합치겠습니다. (그리고 개별적으로도 레벨 분포는 거의 큰 차이 없음을 미리 확인했습니다.) 총 4812장 카드의 레벨 분포 히스토그램은 다음과 같습니다. 



 분명 위의 분포와 다릅니다. 수치해석을 하지 않아도 그냥 육안만으로도 비교가 되는군요. 그러나 도대체 얼마나 분포가 다른지 확인하기 위해서 같이 확률분포함수로 만들어서 비교해보도록 합니다.



 

보시다 시피, 가중치가 없을 때 기대되는 레벨의 확률밀도(붉은색) 와 실제로 뽑힌 카드의 레벨 확률밀도는 현저한 차이가 납니다. (에러바는 그리지 않았습니다. 그리도 지저분해지고 그런것까지 설명하기엔 좀 귀찮아져서..) 에러를 고려하지 않더라도 Lv2카드는 애초에 카드량에 비해서 현저히 (근2배) 많이 뽑히고, Lv4카드는 덜 뽑히게 되어있네요..


  여기서 우리는 분명한 가중치가 있음을 확인 할 수 있습니다. 그러면 우리는 여기서 


"네이버 놈들 좋은 카드는 잘 안나오게 설정하다니 이런 못된놈들 같으니라고" 


  라고 욕을 하는게 맞을까요? 아니요 그렇지 않습니다. 애초에 모든 카드가 동등한 확률로 나온다는 공지도 말도 없었고, 상식적으로도 그렇게 생각하는건 이치에 맞지 않습니다. 좋은 선수는 드물게 나와야 의미가 있지요. 가중치가 있다는것 자체는 아무런 문제가 없습니다. 


  지금 게시판에서 "확률조작"이라고 문제시 되고 있는 것은 이 가중치를 사람에 따라 조정해서 "필요한 카드가 필요한 사람에게 나오지 않도록" 하는가 하지않는가에 있는거지 지금과 같이 카드에 희귀도가중치가 있다는건 전혀 문제가 되지 않습니다.





그렇다면 가중치는 어떻게 알 수 있는가


  어떤 가중치가 있음을 알았다면, 카드별 가중치는 얼마나 다른가? 에 대한 의문이 생깁니다. 사실 이걸 정하는 사람은 게임 개발자이고, 사실 게임안에서 개발자는 신과 다름없습니다. 모든 변수와 파라메터를 조정하고, 심지어 마음에 안들면 게임을 꺼버리거나 리셋할 수 도 있지요. 아무튼 정확한 가중치는 개발자외에 알 수 가 없습니다. 심지어 알아낸다고 하더라도, 개발자가 뭐 심심한데 파라메터들이나 좀 변경할까? 이러면 여태까지의 자료는 무용지물이 되겠지요..위에도 말씀드렸지만, 가중치를 설정한것은 게임 개발자고, 원하면 얼마든지 수정할 수 있습니다. 그래도 아마 그 수정은 점검이나 패치를 기점으로 바뀌겠지요, 예를들어 이번에 라이브 카드가 출시되는데 전에는 사람들이 너무 라이브 카드를 못뽑아서 불만이었으니 저랩 카드 비율을 좀 낮추고 라이브카드의 비율을 좀 올리자. 이런식입니다. 이런건 조작이 아니라 운영이겠지요. 우리가 지금 확인하고 싶어하는건 이런 운영이 아니라 유저를 희롱하는 조작이 있는지, 그리고 기준이되는 대략적인 가중치가 얼마나 되는지, 그 가중치가 과연 변하는지 고정되어있는지 정도는 알 수 있습니다. 바로 카드 노가다를 통해서지요.


  쉬운 예를 들어볼까요? 정육면체 주사위가 있습니다. 1부터 6까지 쓰여져 있는 보통주사위입니다. 각각의 숫자가 나올 확률은 1/6입니다. 즉 아래와 같지요


그런데 공장에서 실수로 인쇄를 잘못해서 6이 인쇄되어야할 자리에 1이 인쇄되어버렸습니다. 즉 1이 2개고 6은 없는 주사위가 만들어진겁니다. 이럴 때 확률적으로 보면, 1의 가중치가 2가 된거고, 6의 가중치는 0이 된겁니다. 아무리 굴려도 6은 나올수가 없고, 1은 원래 나와야할 확률보다 2배 더 나오겠지요. 이제 숫자가 나올 확률은 2/6, 1/6, 1/6, 1/6, 1/6, 0 이 되었습니다. 아래처럼 바뀐겁니다. 



이런 경우에 우리는 가중치를 어떻게 알 수 있을가요? 간단합니다 냅다 많이 주사위를 굴려보면 됩니다. 만약 고장난 주사위임을 모른다고 할 지라도 수십번 수백번 굴려보면, 1은 생각보다 많이 나오고, 6은 왠일인지 전혀 나오지 않음을 알 수 있을 겁니다. 


수백번 수만번 돌려보면 그 비율이 2:1:1:1:1:0 임을 알 수 있겠지요. 근데 여기서 핵심은 "많이" 입니다. 예를들어 주사위를 굴렸는데, 우연히 1, 2, 2, 3, 4, 5, 1, 2 가 나왔다고 2의 가중치는 3이다 라고 말할 수 는 없습니다. 동전을 뒤집었는데 우연히 앞, 앞, 앞, 뒤 가 나왔다고 앞이 뒤보다 3배 가중치가 높다고 이야기 할 수 없는것과 같은 이치지요. 


  많은 분들이 확률에 대해서 잘못 이해하고 있는게 바로 이 부분입니다. 확률에서 "많이" 가 얼마나 중요한지 간과하시는 거에요. 주사위의 확률이 1/6로 일정하다라는 것은 "무수히"많은 주사위를 던졌을 때, 나오는 숫자의 비율이 일정하다라는 것이지, 5번 던졌는데 여태 1이 아직 한번도 안나왔으니 다음에 던질 때에는 1이 나온다 라고 생각하면 안됩니다. 풋볼데이식으로 비교해볼까요?


   골카확률이 대략 1.5%이다. 그러면 100장을 까면 1장의 골드카드가 나와야한다. 그런데 100장을 까는 동안 한장도 안나왔으니 네이버가 확률을 조작하는게 확실하다.


 위 문장에는 2개의 오류가 있습니다. 일단 골드카드의 확률은 위에서 말했듯이 1.5%라고 볼 수 없습니다. 가중치를 고려하지 않은 계산이기 때문이지요, 또하나는 100장을 까면 1장의 골드카드가 나오지 않았다고 확률을 조작한다고 볼 수 없습니다. 이는 확률계산을 (심지어 골드카드가 1.5%로 나온다고 하더라도)  잘못했기 때문입니다. 1.5%의 확률로 골드카드가 나온다면 다른말로 98.5%로 골드카드가 나오지 않는 다는 말입니다. 모든 카드뽑기는 독립사건이므로 98.5%가 100번 나올 수 있습니다. 즉 골드카드가 1.5%라는 말은, 무수히 많은 카드를 뽑았을 때 약 1.5%가 골드카드라는 이야기이지, 100장의 카드중에 1장은 골드카드임을 보장한다는 이야기가 아닙니다.


  아무튼 다시 가중치의 이야기로 돌아가서, 무수히 많은 카드들을 모아서 수집하고 분석한다면, 우리는 카드별, 팀별, 리그별 가중치를 쉽게 구할 수 있을 겁니다. 그러나 여기에서는 그냥 가장 논란이 되고 있는 리그별 가중치가 조작되는가만 확인하겠습니다. (카드별은 statistics모으기도 쉽지 않고, 무엇보다 자료분석하기가 귀찮습니다. 돈받고 하는 일도 아닌데 이렇게 본격적으로 하고싶지는..ㅋ) 


  그리고 날짜별로 가중치가 변경되는가와, 골드카드의 확률가중치는 얼마나 되는가! 1000카드와 9000카드 무엇이 골드카드 뽑기에 유리한가, 그래서 궁극적으로 골드카드는 언제 무엇으로 뽑는게 유리한가! 에 대한 결과는 시간을 두고 틈틈히 정리할 생각입니다만, 공개는 안할 예정입니다. 솔직히 사기라느니 호갱님이라느니 하는 분들때문에 마음이 좀 상했거든요, 도와주신 분들과 지원자, 그리고 친한 지인들과만 공유할 예정입니다. 

 




과연 확률 조작은?

 

  아무튼 각설하고, 보내주신분들의 리그 분포를 보면, 분데스리가와 라리가를 모으시는 분들이 제일 많군요. 아마 182나 82명의 자료를 보내주신분들은 주전과 교체를 제외한 나머지 2군을 싹 비우신다음에 돌리신 분들인가 봅니다. 아니더라도 자신이 모으는 리그 외에 리그는 거의 (혹은 싹다) 제거하시고 보내주신 분들이니 이분들의 자료를 가지고 분석을 해보지요. 먼저 아래의 히스토그램을 보십시오



  보라색은 분데스리가 모으시는 분의 250장 결과, 파랑색은 세리에(유벤투스16)를 보유하신 분의 400장 결과입니다. 얼추 비슷한거 같으면서도 조금 다르지요? 자, 확률조작이 있다고 해야할까요 없다고 해야할까요? 보라색에서는 라리가가 EPL보다 많이 나왔지만, 파란색에서는 라리가가 EPL보다 적게 나왔습니다. 그런데 이게 표본이 적어서 생기는 오차인지, 아니면 뭔가 확률의 문제인지 말하기는 애매합니다. 아까도 이야기했듯이, 주사위를 겨우 20번 던져가지고는 그 가중치를 확인할 수 없기 때문이지요, 그래서 오차(Error bar)가 필요합니다. 그리고 두 표본수의 차이 문제도 있구요. 일단 둘을 동등하게 비교하기 위해서 두 히스토그램의 integral값이 1이 되도록 normalize를 하고, 이때 생기는 에러를 같이 그려보겠습니다. 좀 귀찮은 작업이지요.

  개노가다였습니다. -_- txt로 보내주신 파일은 perl로 처리하였습니다. (이렇게 보내주신분 감사)



그러나 이렇게 나름 정리해서 보내주신분은 오히려 힘들었어요 (ㅠ_ㅠ)


  아무튼 이번글에서 여러분이 가장 보고싶어하실 Plot을 공개합니다.



오, 경향성이 꽤 있군요. 여기 Case는 처음 글 서두에 있는 순서입니다. 결국 라리가를 모으나 분데스리가를 모으나 세리에를 모으나 나오는 카드의 결과는 대략 비슷합니다. 이정도면 에러바 안에서 일치한다고 보아야겠지요. 다만 Flucuation이 큰 편입니다. 이게 과연 Statitics가 늘면서 줄어드는 건지에 대하여서는  좀더 연구해볼 가치가 있겠습니다만, 큰 의미는 없을 것 같고... 어쨋든 경향성은 확실히 보입니다.


  여전히 의문을 가지고 계신분도 계실겁니다. 근데 왜 각 Case마다 정확히 일치하지 않는거죠? 왜 누구는 라리가가 더 높고 분데스리가가 더 낮죠? 누구한테는 분데스리가가 더 높죠? 이런식으로 말이죠. 이유는 간단합니다. 이 리그는 팀들의 모임이고, 팀은 다시 개개인 카드의 모임입니다. 카드는 하나하나는 2600여장이 넘고, 팀만하더라도 100여팀이 넘습니다. 이들의 평균 Sum이 저렇다는 것이고, 2600여장이 넘는 총 경우의수에서 4000여장의 표본은 그리 큰 표본이라고 할 수 없습니다. 저정도 Fluctuation이야 에러바로 퉁치고 넘어가야되지요. 


 일단 적어도, 자기가 모으는 리그의 카드는 나오지 않도록 카드뽑힐 확률이 조작된다 라는 주장은 결국 틀린것으로 보이는군요. 적어도 그런말을 하기위해서는 리그별 편차가, 리그내 편차에 비해서 작아야합니다. 굳이 fit을 하지 않아도 그렇게 보이지는 않는 군요. 게다가 심지어 게시판에 있는 글처럼럼 내가 원하는 리그는 30개를 돌려도 1개도 안나오더라, 이런말을 뒷받침 하기위해서는 완전히 다른 분포의 히스토그램을 보아야합니다만, 그건 아닌거 같네요. 즉 실시간으로 카드의 가중치가 변한다는 말은 전혀 신빙성이 없습니다. 2군에 일부러 모으지 않는 팀을 남겨둘 필요도, 스스로의 스쿼드를 일부러 잡덱으로 만든뒤에 카드를 돌릴 필요도 없겠네요.

 

 

간단한 테스트


  갑자기 재미있는 생각이 들었습니다. 간단한 테스트입니다.

라리가에는 총 479명의 선수가 뛰고 있습니다.

리그앙에는 총 542명의 선수가 뛰고 있습니다. 


  대충 라리가는 리그앙의 88% 정도의 선수를 보유하고 있군요. 반대로 말하면 라리가와 리그앙의 선수 비율은 1 : 1.131 의 비율이라고 할 수 있습니다. 그렇다면 그 안에 리그인원의 레벨 비율은 어떨까요?  열심히 검색을 해서 뒤져보니 다음과 같습니다.




 라리가의 수준이 전체적으로 리그앙보다 높군요. 평균레벨도 0.5정도 차이가 납니다. 그렇다면 처음 위에서 구한 레벨별 카드 가중치를 곱해서 두 리그의 차이를 보면 어떨까요?

 

 레벨별 카드 가중치는 다음과 같이 구할 수 있습니다. 기대되었던(가중치가 1이었던) 카드의 값을 실제 나왔던 카드의 값으로 Bin by Bin으로 나누어주면 되지요.  Bin값은 다음과 같았습니다.


 

그렇다면 위에 계산한 레벨 가중치로 각 라리가와 리그앙의 기대값을 계산해볼까요? 단순 비율만을 보기위한 테스트이므로 그대로 곱하면


  라리가는 457,

  리그앙은 696, 이 나오는군요.


즉, 라리가는 3, 4랩 선수가 많기 때문에 오히려 줄어들고, 리그앙은 1, 2랩 선수가 많기때문에 늘어나는 효과가 있습니다. 둘의 비율은 1.522 정도 됩니다. 무슨말인지 이해가 되시나요? 리그앙과 라리가의 선수인원차이는 고작 60여명이지만,(즉 리그앙이 13% 많은 뿐이지만) 레벨을 고려하면 사실은 130명 정도의 차이가 난다는 겁니다. 그런데 이정도 차이면 아까 보았던 리그별 분포 최종 결과와 맞지 않을까 의심스럽지 않습니까?  


  최종 Plot 에서 라리가와 리그앙의 Fit 값 Vaule가 각각 0.1521 와 0.232 이었으니 비율은?  1.525 가 됩니다.!!!! 아직 무슨말을 하는지 눈치 못채신분이 계실지도 몰라서 해석드리면, 리그앙이 라리가에 비해서 훨씬 많이 나오는 이유는 단순히 리그앙의 인원이 더 많기 때문이 아니라, 리그앙의 인원이 더 많은 데다가, 리그앙에 레벨이 낮은 선수가 많이 포진되어 있기 때문입니다. 당연한거 같다구요? 그러면 이렇게 말씀드리죠  리그별 가중치 따위는 없고(따라서 조작도 없고), 레벨별 가중치많으로 계산해도 추가 Parameter없이 최종 결과와 잘 일치한다는 겁니다. (즉 확률 조작따위는 없다)


  마치 거짓말처럼 맞는군요. 다른 리그로 해보면 좋겠지만, 이미 귀찮습니다. 자료는 다 공개되어있으니 직접해보시길 바랍니다.



최종결론


티스토리가 미쳤는지 결론쓰고 있는데, 로그아웃되고, 다시 돌아와보니 써둔 결론이 없어졌습니다. 의욕이 감소되어서 대충 쓰겠습니다.


  •   일단 카드별로 희귀도는 정해져있고, 확률용어로 그것을 가중치라고 부릅니다. 이는 모든 카드마다 동일한게 아니라 (아마도 레벨별로) 각각 정해져 있습니다. 

  •   자신이 어떤 리그를 모으고 있다고 해도, (즉 자신의 스쿼드가 특정 리그로 채워져 있다고) 그 사실이 앞으로 뽑는 카드의 리그를 결정하지 않습니다.

  •   수치는 공개하지 않겠습니다만, 1000원짜리 카드에서 골드카드 나올확률은 여러분이 생각하시는 것보다(누군가 계산한 1.52%보다) 훨씬 낮습니다. (좀더 표본이 필요하긴 하지만 9000원짜리 카드에서 골드카드가 나올확률은 계산중입니다.)


여기까지가 이번 실험으로 이루어낸 Result입니다. 그리고 이후는 저의 개인적인 의견입니다. 무시하셔도 귀를 귀울이셔도 상관없습니다.


  일단 아무런 설치를 하지 않는 웹-플렛폼 기반 게임에서 클라이언트는 말그대로 최종결과를 모니터에 뿌려주는 일 외에는 하지 않습니다. 대부분의 실제 계산과 시뮬레이션은 서버에서 이루어지겠죠, 그런 서버에서 괜한 부하(load)를 걸기 위해서 각 계정에서 가지고 있는 카드를 분석해서 가중치를 바꿔서 Random함수를 돌리는 일을 한다고 하는 건 사실 그리 신빙성 높은 이야기는 아닙니다. 물론 시스템적으로 구현할 수야 있겠지요, 하지만 이 게임은 그렇지 않아도 이미 극악의 확률 게임입니다. 2500여장의 카드중에 원하는 카드가 나올 확률은 사실 높지 않습니다. 확률은 기본적으로 곱연산이기때문에 "자신이 원하는 리그", "자신이 원하는 팀", "자신이 원하는 포지션", "중복되지 않는 카드" 와 같은 조건이 하나 들어갈 때마다 확률은 뚝뚝 떨어집니다. 주변이 키가 나보다 작으면서 긴 생머리에 착하고 이쁜 솔로 여자 찾기가 생각보다 힘들다는걸 명심하세요 :)


 그리고 마지막으로 왜 내가 원하는 팀은 안나오는지에 대해서 한가지 설명 추가하면서 오늘 블로깅을 마무리 하겠습니다. 

  

 생일문제에 대해서 아시나요? 위키에 따르면

생일 문제(生日問題)란 확률론에서 유명한 문제로, 몇 명 이상 모이면 그 중에 생일이 같은 사람이 둘 이상 있을 확률이 충분히 높아지는지를 묻는 문제이다. 얼핏 생각하기에는 생일이 365~366가지이므로 임의의 두 사람의 생일이 같을 확률은 1/365~1/366이고, 따라서 365명쯤은 모여야 생일이 같은 사람이 있을 것이라고 생각하기 쉽다. 그러나 실제로는 23명만 모여도 생일이 같은 두 사람이 있을 확률이 50%를 넘고, 57명이 모이면 99%를 넘어간다. 이 사실은 일반인의 직관과 배치되기 때문에 생일 역설이나 생일 패러독스라고도 한다 


라고 되어있습니다. 즉, 특정팀을 정해놓고 그 팀이 나오기를 바랄 때의 확률은 굉장히 적은데(아래의 파란선), 어느팀이든 좋으니 팀이 같은 두장의 카드가 나오기를 바라는 것(초록선)은 의외로 높다는 이야기 입니다.



다들 처음에는 카드를 뽑아서 어느정도 뽑힌 팀/리그를 모으기 시작하지요, 이게 바로 초록색입니다. 그러나 어느순간부터는 베티스, 바르샤 처럼 특정 팀을 모으기 시작하지요, 이때부터는 파란선을 따라가는 겁니다.  이유는 아까 말했듯이 확률은 곱연산으로 이루어지기 때문이지요. :) 결코 확률을 무시하시면 안됩니다.



반응형

'e-Logbook' 카테고리의 다른 글

음모론을 주장하는 사람들의 패턴  (2) 2014.01.25
카톨릭 전례 예식  (2) 2014.01.06
음악과 물리 - 평균률과 순정률  (0) 2014.01.02
kimsufi 임대서버로 단 10초만에 시드박스 만들기  (0) 2013.08.09
Perl  (0) 2013.06.12