길위에서 에 해당하는 글8 개
2010/02/08   암담한 현실? (4)
2008/09/22   리얼이 제자리를 찾다.! (2)
2008/06/04   신기한 경험. (5)
2008/05/02   Radom shuffling
2008/04/16   삽질기 - java, List interface (2)
2008/04/13   hadoop 삽질기 (2)
2008/03/27   chunk view (8)
2008/03/20   도메인 획득. (2)


암담한 현실?
길위에서 | 2010/02/08 11:01
sigmoid function 관련 내용을 찾다가

어느 블로그에서,

"전 ~~할땐 sigmoid 보다 tanh 를 써요. 결과가 더 ~~ 하데요"
"tanh 는 생각못했는데 그것도 괜찮겠네요~"

라는 식의 글을 봤다.

하지만, 불행히도.
sigmoid function 과 tanh function을 google씨에게 물어보면..
engineering 관점에서 두 function이 동일한 function임을 쉽게 알 수 있다.
-engineering 관점에서 동일하다함은, tuning value의 조정만으로 같아지는 function이라는 얘기다
말하자면 위의 대화는
"전 2+2보다 2*2가 결과가 잘나오는거 같아요~"
뭐 이런...식이라고 해야하겠지..ㅎㄷㄷ
중학생도 알 수 있을만큼 복잡하지 않은 변환으로 알 수 있는 내용이니..
설마 수식을 보고도 몰랐을 리는 없고..

요는,

sigmoid 건, tanh 건 어떤 논문을 통해서건 아니면 누군가의 블로그, 칼럼을 통해서건
아~ 이럴때 이런 function을 쓴다더라
라고 하면, 그 내용에 대한 최소한의 조사도 없이 맹목적으로 사용한다는 것이겠지.
거기다... 그들이 불행히도 검색업계의 알만한 기업에서 어느 정도 포지션을 갖고 있다는 것이..
암담한 현실이랄까.

덧붙이기 : 아아..거기다가 sigmoid는 0~1 value 를 가지니 확률로도 사상할 수 있다~ 라는...
               무시무시한 소리도....0~1이라 확률로..라니..확률이 뭐라고 알고 있길래;;
               (물론 ,0~1 value를 갖는 연속내지는 미분가능함수는 확률로 사상할 수 있다.
                cdf로 보고,  pdf 의 distribution을 domain이 만족한다는 가정 혹은 증명 아래서 말이지.
                0~1 이 되니 아무거나 집어넣어놓고 확률이에요 하면 곤란하다고..)
크리에이티브 커먼즈 라이선스
Creative Commons License

 
 
 
태그 : 공부좀하세요
트랙백0 | 댓글4
이 글의 관련글(트랙백) 주소 :: http://www.waityet.net/trackback/42 관련글 쓰기
BlogIcon 슈레인 2010/02/08 17:57 R X
저는 한글로된 자료는 버리기로 했어요 ㅋ_ㅋ
BlogIcon waityet 2010/02/12 17:46 X
난 버리진 않고 참고는 해..
위의 예에서.. 단순히
sigmoid function 식이 뭐더라...라는 거는
한글자료에서도 잘 나오니까 ㅋㅋ
BlogIcon dgoon 2010/02/11 13:53 R X
그래서 요즘 뭐하시나염? ㅋ
BlogIcon waityet 2010/02/12 17:47 X
확률놀이.
약간의 코딩.
그리고 많은 삽질.
레비때 chunk 만들던때랑 비슷함.
아이디 :
비밀번호 :
홈페이지 :
  비밀글로 등록
내용 :
 



리얼이 제자리를 찾다.!
길위에서 | 2008/09/22 09:28
전에 회사에서 쓰다가..
잠시 집으로 들고갔던 리얼이..
불쌍하게도 맨..게임에만 사용되던 녀석이..
드디어 다시 제자리를 찾다..

쩝..집에 놓고 써서, 담뱃재를 뒤집어쓴 상태 ㅜ.ㅜ
날 잡아서 대청소?를 시행해야겠다....
-흠. 혹시 청소도구를 구비하신 분은 연락바람...후사 하겠음-

역시 모든 것은,
목적에 맞는 위치에 존재할때 가장 멋져 보이는 듯.
집에서 뒹굴때는, 도대체 그 포스를 느끼기 힘들었던 녀석이
사무실에 오자마자, 손맛부터 달라진 듯 하다. ㅋㅋ
크리에이티브 커먼즈 라이선스
Creative Commons License

 
 
 
태그 : 리얼이
트랙백0 | 댓글2
이 글의 관련글(트랙백) 주소 :: http://www.waityet.net/trackback/32 관련글 쓰기
BlogIcon 슈레인 2008/09/22 09:48 R X
입사턱 쏘셔야죠 ^^
BlogIcon waityet 2008/09/24 13:01 X
흘흘흘...주말이라면...=_=
아이디 :
비밀번호 :
홈페이지 :
  비밀글로 등록
내용 :
 



신기한 경험.
길위에서 | 2008/06/04 15:31

음. 면접 보면서 까칠?하게 굴었던건지..
인터뷰에 대한 결과로 ....
"한 동안 같이 일해보고 결정해요.."
라는 대답이 왔다 -_-;

하하,
내가 좀 까칠하기는 하지만서도 ㅡ.ㅡ

함께 일해본 사람들에게 물어야할 일이지만,
나름 나 스스로의 생각으로는
'같이 일을 해보고도 나를 마다할 리가 있냐!'
라는
광오?한 생각에,
또, 집에서 뒹굴거리기보다 일하는게 나은 듯 하기도 하고,
또, 왠지 애매한 상태로 그만두기도 맘에 안들고 하여.

그러기로 함.

어찌되건,
남들 다 해보는 건 아닌
이상한 경험?
신기한 경험?
을 하게 되다 ㅡ.ㅡ/

크리에이티브 커먼즈 라이선스
Creative Commons License

 
 
 
태그 : 면접결과
트랙백0 | 댓글5
이 글의 관련글(트랙백) 주소 :: http://www.waityet.net/trackback/25 관련글 쓰기
BlogIcon 슈레인 2008/06/04 19:51 R X
ㅊㅋ 결국 입사하시는군요
BlogIcon waityet 2008/06/14 09:28 X
뭐, 완전?입사도 아닌데
축하할 일인지는 잘 모르겠다 ㅋ
면접에서 'No'가 아니니 축하할 일인가?=_=;
BlogIcon deisys 2008/06/05 22:34 R X
끌끌끌...
리얼훠스 지를까 말까 고민중인데...
정말 좋음?
BlogIcon waityet 2008/06/14 09:27 X
좋아좋아..ㅎㅎ
2008/06/12 01:07 R X
비밀댓글 입니다
아이디 :
비밀번호 :
홈페이지 :
  비밀글로 등록
내용 :
 



Radom shuffling
길위에서 | 2008/05/02 09:22

생각보다 자주 맞이하게 되는 간단한 문제.
random shuffling.

많이 알려진바와 같이, 간단한 구현이지만 작지않은 함정이 존재한다.
-얼마전까진, 간과해왔던...-

1,2,...,n 의 sequence를 random shuffle 한다는 것은,
결과의 sequence a1,a2,...,an의 각 위치에 대한 확률이 모두 1/n으로 결정되는 것.

아무생각없이 아래와 같은 코드를 작성하곤 했는데...

for(int i=0;i<n;i++)
    swap(a[i],a[random(n)]);

...
이녀석은, 1/n의 확률을 유지해주지 못한다......쩝.

for(int i=0;i<n;i++)
     swap(a[i],a[random(n-i)]);

이녀석은, 1/n의 확률이 유지된다...
-간단한 문제니 pass..모른다면, 확률 공부를 하시길...

요는,
아무리 간단한 문제라도 문제의 요구사항을 명확히 하고 그것을 만족하는 결과를
만들어내고 있는가를 검증하는 것을 소홀히해서는 안된다는 것.

크리에이티브 커먼즈 라이선스
Creative Commons License

 
 
 
태그 : random shuffle
트랙백0 | 댓글0
이 글의 관련글(트랙백) 주소 :: http://www.waityet.net/trackback/19 관련글 쓰기
아이디 :
비밀번호 :
홈페이지 :
  비밀글로 등록
내용 :
 



삽질기 - java, List interface
길위에서 | 2008/04/16 22:26

대량의 자료를 다루게 되면서,

점점 봐줄수 없을 정도의 속도가 나오기 시작.

워낙에, 믿음을 주지 않던 hadoop이라, 일단 hadoop의 문제야! 라고 생각하고,

DFS가 아닌 local file로 output을 변경해보다.

여전히...못봐줄정도.

이제 다른 부분을 고민해보기 시작하다.

곰곰히 코드를 살피다보니...

아뿔싸...

말만 List이지...구현은 vector인 ArrayList에다 insert를 마구 하고 있었다....OTL

난 list라고 생각했어...라고 할 수만도 없는게...

random access를 이용해 binary search를 하고 있었다.....에고.

뭐, List interface에 왜 random access가 있으며, reference를 이용한 constant time의 insert가

없는거야! 말도안돼! 라면서..투덜대기는 했지만.

충분히 조심스럽게 살펴보지 못한 나의 불찰...

쩝. complie 되고, 잘 돌아간다고 다 제대로된 코드가 아니란걸, 다시 한번 배우다..

크리에이티브 커먼즈 라이선스
Creative Commons License

 
 
 
태그 : java, 자바
트랙백0 | 댓글2
이 글의 관련글(트랙백) 주소 :: http://www.waityet.net/trackback/17 관련글 쓰기
BlogIcon 슈레인 2008/04/16 23:46 R X
안습
BlogIcon waityet 2008/05/01 21:25 X
ㅠ.ㅠ
아이디 :
비밀번호 :
홈페이지 :
  비밀글로 등록
내용 :
 



hadoop 삽질기
길위에서 | 2008/04/13 07:55

도대체, hadoop collect 에서는 무슨 일이?

hadoop을 사용하면서 다양한 문제에 부딛히게 되었지만, 그 중에서도 가장 빈번히 당혹스럽게 하는

것은, collect과정에서의 에러들.

같이 일하는 shurain군은, 그런 에러들을 보면서 한마디 하곤한다.

"대체, 이럴때 제가 할 수 있는 일이 뭐가 있죠?"

코드 상의 버그도 아니고, 설정상의 오류도 아니고, 그저, 파일에 써보렴! 이라고 했는데

다양한 에러들을 뱉어내며 죽어버리는 task들을 볼땐, 나도 저 말이 떠오르곤 한다....

map 과정에서의 collect와 reduce 과정에서의 collect는 약간 다른 동작을 가지고 있지만,

공통적으로 들어가는 것은,

1. memory byte buffer로 collect된 객체들을 쓴다.

2. 납득할 수 없는 아주 저렴한? 알고리즘으로 계산된 buffer overflow계산을 통해,

    buffer가 꽉 차면 flush 한다...


stream이라면, 누가 하더라도 당연히 갖고 있는 두 가지 과정인데..

희한하게도 hadoop은 저 과정들을 제대로 수행하지 못하는 경우가 태반이다.

좀 더 세세히 살펴보아야 하겠지만,-전혀 그러고 싶은 욕구는 생기지 않는다- 예상되는 바로는

1.저렴한, 아주 저렴한...누구도 납득할 수 없는 buffer overflow계산 알고리즘..의 문제.

   황당하게도, stream인 주제에, out of memory를 내며 뻗는 경우도 있으니..할말 다했지..

2.flush를 하는 과정에서 buffer를 나눠 쓰는 알고리즘의 문제.(이건 안열어봤다.)

3.collect과정에서 즉, mapreduce package쪽 buffer를 1차로 거치고, dfs쪽에서 다시 stream을

  사용하면서 buffer를 거치는데, 역시나 1과 연관된 이유로 인한 이중으로 사용되는 buffer를

  제대로 처리하지 못하는 문제...

등이 머리속에 떠오른다.

뭐, 코드야 어찌되었던, hadoop을 고쳐주고 싶은 마음은 이제 생기지 않기 때문에,

대충의 해결책을 찾았는데...

collect를 호출하지 않고, output format으로부터 직접 writer를 가져와 write를 통해 쓰거나,

이것도 미심쩍은 경우에는, 직접 output format을 작성하는 것이다.

아마도, hadoop내의 mapreduce 쪽 코드보다는 dfs쪽이 좀더 안정화되어 있는듯,

collect를 통하지 않은 write만으로도 대부분의 에러상황을 피해갈 수 있다.

덧붙이기 : 여기 써놔봐야..읽을 수 있겠냐마는, 아무리 오픈소스라지만, 제발 니 머리속에서만

              검증된 코드들을 작성해서 commit 하지 말란말이다...

--------------------------------------------------------------------------------------
여기저기 확인해본 결과, hadoop 의 buffer 사용 쪽의 code들이 전체적으로 불만족 스러운듯.
buffer size에 대한 soft limit을 적용한 결과..
필수적으로 필요한 memory를 확보하지 못한채 flush 를 시작한다던가, 아예 flush도 못하고
그냥 죽어버린다던가.....
이에 대해...답변은...쩝.
좋은 컴퓨터에 메모리 많이 잡고...돌려라..정도라니 =_=;
stream에서 out of memory 뜨는 걸 확인하는 순간...심각하게 고민을 해봤어야했다고.
이제와서 조금 후회중.

크리에이티브 커먼즈 라이선스
Creative Commons License

 
 
 
태그 : hadoop, 하둡
트랙백0 | 댓글2
이 글의 관련글(트랙백) 주소 :: http://www.waityet.net/trackback/16 관련글 쓰기
BlogIcon 슈레인 2008/04/13 12:24 R X
보면 볼 수록 안습. 파티션의 역습도 개안습이던데 - _-;;
BlogIcon waityet 2008/04/15 20:41 X
그러게나 말이다..
파티션의 크기 고려없이 block들을 나눠준다니..ㅎㄷㄷ
왠지..알아갈수록..
'만들기 싫지만 대충 기능을 구현은 해주지..'
라는 느낌이랄까? 이거 뭐...숙제로 제출하는 코드도
아니고...쩝
아이디 :
비밀번호 :
홈페이지 :
  비밀글로 등록
내용 :
 



chunk view
길위에서 | 2008/03/27 13:02

이번에 회사에서 데모용으로 그 동안 필요하다고 느끼면서도 계속 미뤄왔던, chunk-단일 site내의 동류page의 묶음- viewer를 만들었다.

시간관계상, node random으로 배치해서 좀 보기 어렵긴 하지만, 대략적인 파악은 가능.

사용자 삽입 이미지

tistory내의 sample set에 대한 page view이다.

link의 바다라고 말은 많이 들었지만, 이렇게 해놓으니 정말 link로 꽉 차있다는 것이 실감난다.

사용자 삽입 이미지

chunk view.

-보기 좋게 손으로 정리했다.

tistory의 구조가 깨끗해서 일까?

거의 개인 블로그 단위로 chunk가 분리됨을 보여주었다.

사용자 삽입 이미지

주목할만한 것은, tistory.com www.tistory.com이 함께 chunk로 묶인다는 것.

처음 알고리즘을 고안할 때, hostname이나 url 구조를 이용해서 site내의 page를 분류하는 것과 다를 것이 있냐는 말이 있었는데, url과 관계없이 동류로 볼 수 있는 page들을 함께 묶어낼 수 있음을 보여준다.

앞으로 parameter 조정 및 세부개선이 끝없이 남아있지만, test view에서 기대하는 방향으로 결과가 나와주어 조금 힘이 난다.

크리에이티브 커먼즈 라이선스
Creative Commons License

 
 
 
태그 : chunk, 검색, 레비
트랙백2 | 댓글8
이 글의 관련글(트랙백) 주소 :: http://www.waityet.net/trackback/15 관련글 쓰기
Tracked from Psychedelic Mind 2008/03/27 17:08 x
제목 : 요새 하는 일
http://waityet.tistory.com/entry/chunk-view 요새 회사에서 이런 일도 하고 저런 일도 하고... "저것"의 오너쉽은 waityet에게 있지만 팀의 많은 사람들이 고민한 이야기 :)
Tracked from D군동네 2008/03/27 20:32 x
제목 : Chunker's rolling out!
휴우... 빡센 한주가 가고 있다. 회사에서 틈만 나면 대통일 클러스터링이 어쩌고 저쩌고 하며 떠들던 우리 팀들, 드디어 두근거리는 가슴을 안고 잘라 봤는데... ㅎㄷㄷ 정말 생각대로 졸라짱 훌륭하게 잘라냈다. 그다지 큰 문서셋은 아니지만, 튜닝이고 뭐고 할 것 없이 거의 완벽하게 잘라내셔서 감동먹었다. 후후, chunker 주인 겸 visualizer 주인인 waityet도 결과가 너무 잘 나와서 물고있던 담배를 떨어뜨릴 정도로 놀라셨다고 한다...
BlogIcon 슈레인 2008/03/27 13:08 R X
RSS 공개해주세요 ㅠㅠ
BlogIcon waityet 2008/03/29 14:13 X
rss 공개 했당..=_=;
BlogIcon deisys 2008/03/27 20:32 R X
후후 나도 트랙백 쏴봤음 ㅋㅋㅋ
BlogIcon waityet 2008/03/29 14:13 X
첫 트랙백 ㅜ.ㅜ
감동이야 ㅋ
BlogIcon idealiot 2008/03/28 15:57 R X
수고 많으셨음! 감동먹었음 ㅜㅜ
BlogIcon waityet 2008/03/29 14:14 X
음.
진작 했어야 하는 것을 닥쳐서 하느라 고생했지 뭐 ㅋ
다양하게 실험을 해봐야하니, 조금만 감동하고
계속 상황을 보자구...
osyadk 2008/04/01 23:28 R X
아...홈피 복잡해!
BlogIcon waityet 2008/05/01 21:30 X
뭐가 복잡해...ㅡ.ㅡ;
아이디 :
비밀번호 :
홈페이지 :
  비밀글로 등록
내용 :
 



도메인 획득.
길위에서 | 2008/03/20 10:02

얼렁뚱땅 waityet.net 을 획득.

D군의 옆구리 찌르기에 정신이 몽롱한 상태에서 반응해 버리고 말았다.

내 것이 하나 늘면,

그만큼 신경써야 할 것이 늘어나는 것을...ㅠ.ㅠ

여튼,

waityet.net 획득.

-사실...뭐 아무도 관심없는 도메인이라 딱히 이벤트성이 있지도 않지만...-

크리에이티브 커먼즈 라이선스
Creative Commons License

 
 
 
태그 : 도메인
트랙백0 | 댓글2
이 글의 관련글(트랙백) 주소 :: http://www.waityet.net/trackback/12 관련글 쓰기
BlogIcon deisys 2008/03/27 20:23 R X
후후후
BlogIcon waityet 2008/03/29 14:38 X
흠. 남자라면, 느낌 왔을 때 지르는거다!
디카는 언제 살거야? >.< ㅋㅋㅋ
아이디 :
비밀번호 :
홈페이지 :
  비밀글로 등록
내용 :
 



위치로그 : 태그 : 방명록 : 관리자
waityet's Blog is powered by Daum / Designed by SSen
관리자  |  글쓰기
BLOG main image
beautiful way 2 death ""
 Category
 TAGS
 Recent Entries
 Recent Comments
 Recent Trackbacks
 Link Site
 Archive
 Media
 Calendar
 Visitor Statistics
+ Total : 13,990
+ Today : 2
+ Yesterday : 5
카피
rss