본문 바로가기
반응형

e-Logbook40

ROC-AUC 를 score로 사용하는 사람들의 흔한 실수 통상 분류(Classification) 은 회귀 예측보다 그 평가 지표를 정량화 하기가 어렵다. 그래서 Cross entropy 같은 다소 복잡한 loss function 을 쓰기도 하는데, 그래도 이진분류 (0 or 1) 에서 가장 흔하게 사용되는 평가 지표는 물론 정합도 (accuracy) 겠지만, 다루는 데이터가 한 쪽으로 심하게 치우친 경우 (imbalanced data)에는 Accuracy는 사실 별 도움이 되지 않는다. 이를 위해 F1-Score 또는 balanced score를 사용하기도 하는데, 이 또한 모델의 자체 성능보다, 이를 분류로 반환하는 cut-off 에 크게 좌지우지 되기 때문에 모델의 성능을 평가하는데에는 썩 좋은 지표라고 하기 어렵다. 그래서 많이 사용하는게 roc-auc .. 2022. 6. 6.
안드로이드에서 SSH를 이용한 터널링 SSH를 통한 포트포워딩으로 터널링을 하면 쉽게 IP를 우회함으로써 여러가지 트릭을 부릴 수 있다. 간단하게는 차단된 사이트 (예를들어 국내에서 접속할 수 없게 되어 있는 북한의 우리민족끼리 같은 사이트)를 접속할 수 있으며, 기타 IP 주소를 확인함으로써 차단되는 여러 사이트를 접속하는데 사용할 수 있다. http 프록시로도 비슷한 효과를 누릴 수 있지만, SOCKS5 (Socket Secured 5)의 경우는 네트워크 페킷을 구분하지 않기 때문에 트래픽 자체를 유연하게 프로토콜을 변경할 수 있다. (토렌트, ftp, http 등에 모두 사용 가능) 물론 이보다 더 강려크한 VPN 같은 개념이 있지만, vpn 은 일반적으로 느리고, 중계서버가 유료인 경우가 많으며 무엇보다 별도의 앱이나 프로그램이 필요.. 2021. 6. 29.
프로그램 설치 없이 차단 사이트 우회 접속 방법 (MTU변경) HTTPS 차단 MTU를 활용하여 우회하기 최근 방송통신 위원회에서 "불법 유해사이트" 의 전면차단이 시행되었다. DNS를 사용한 네임 서버 접촉에서 네트워크 장비에서 유저가 특정 도메인의 IP 를 요구하는 지를 확인 후 유해사이트의 도메인이 포함되어 있으면 warning 문구를 띄우는 방식이다. 사실 친한 몇몇과는 이야기했지만, 나의 한결같은 생각은 늘 동일하다 "불법유해사이트가 있다면, 일차적으로는 사이트를 폐쇄하고, 이차적으로는 사이트를 개설한 사람을 엄벌에 처함으로서 일반적인 예방효과를 노리는게 정상적인 사고방식이지, 불법유해사이트에 접근하는지를 모니터링 후에 이를 차단하는게 제대로 된 접근방법이라고 생각되지는 않는다" 물론 저작권 보호, 불법 음란물 근절 명목의 사이트 차단이 뭐가 문제냐고 반문.. 2019. 2. 18.
[R] 데이터 손실 없이 ggplot 줌인/줌아웃 하기 (scale, limit 변경) [R] 데이터 손실 없이 ggplot으로 zoom in/out [R] 데이터 손실 없이 ggplot으로 zoom in/out R with ggplot 통계 분석용 언어중 하나인 R 은 그 자체로도 매우 훌륭하지만, 여러 페키지들을 사용하면 그 효용과 활용성이 크게 증가한다. 특히 많이 쓰는 페키지로는 tidyverse, data.table 등등이 있지만, 그 중에서도 시각화에 관련해서 단연 최고라고 할 수 있는 ggplot2 를 절대 빼놓을 수 없을 것이다. 다만 Grammar of Graphics 라는 이름에서부터 느껴지듯, 그림을 그리기 위해서는 ggplot 만의 문법에 어느정도 익숙해져야 하는데 대략적인 사용법은 다음과 같다. library(ggplot2) ggplot(data=diamonds, a.. 2019. 2. 9.
반응형