RecSys'18@Vancouver trip report

10月上旬にRecSys'18というレコメンデーション分野の国際会議に初参加してきた。出張報告がてらに聴講した内容をまとめる。twitterに記録していたので文章はそこから起こした。時差ぼけもあり、全部は聞けていないので悪しからず。 レコメンデーション分野は…

TDサマーインターン(2018年) 募集開始

今年もトレジャーデータでサマーインターンの募集を開始しました。 締め切りは6/30(PDT)です。 ただし、6月1日より選考を開始し、各テーマ定員になり次第応募を締め切りますのでご注意ください。 jobs.lever.co インターンの内容や応募については過去のイ…

2017年を振り返る(山登り)

こんにちは。好きな本(山ジャンル)は山野井泰史の「垂直の記憶」*1、植村直己 の「青春を山に賭けて」*2、ちょっと前からハマっている漫画は「山と食欲と私」のmyuiです。2017年の山行を振り返ります。 垂直の記憶 (ヤマケイ文庫)作者: 山野井泰史出版社/…

Treasure Data Summer Intern 2015

8/3〜9/30 の2ヶ月間、トレジャーデータ(以下、TD)ではSummer Internで3名の学生を受け入れ、その受入責任者を担いました。 初めての試みでしたが、いずれの学生も優秀で与えられたタスク*1を成功裏にこなしてくれました。 熱が冷めないうちに、来年度のた…

Treasure Dataを支える(中の人に必要な)技術

Treasure Data(以下、TD)に入社して早2週間が経ちました。 入社してから、平成14年度IPA未踏ユース第1期で同期でスーパークリエイタであった西田さんがTDで働いているのを知りました。MapReduceやHadoopが登場した頃、「Googleを支える技術」という技術書*…

Treasure Dataに入社しました

3/31付けで4月から国立研究開発法人になった産業技術総合研究所を退職致しまして、4/1からTreasure Dataに入社しました。第一号のResearch Engineerとして東京オフィスで働きます。 CTOの太田さんから2013年頃に一度お誘いを受けておりましたが、2014年にな…

Prestoのcodegen

以前、Prestoのバイトコード生成部分のソースコードを読んだので、hack再開時のためにメモしておく。 コード生成にはobjectwebのASMを利用している。Parser generatorはANTLR。 ExpressionCompiler#internalCompileFilterAndProjectOperator codegenしている…

Multiplexed Reservoir Sampling

Xixuan Feng Arun Kumar Benjamin Recht Christopher Ré: "Towards a Unified Architecture for in-RDBMS Analytics", In. Proc, SIGMOD, 2012. だいぶ昔に読んだ論文だけどIn-database AnalyticsのBismarckの論文にMultiplexed Reservoir Samplingというの…