© 2019 by SciPy.

お問い合わせ( Eメール):

scipy@enthought.com

トーク&チュートリアル
スケジュール
​トーク

f(x) = a + bi

あなた(x)の未来(f)は原子(リアル)と二進数(仮想:サイバー)によって決まる

Keynote: f(x) = a + bi  

Your (x) Future, f, Depends on Atoms (Real) and Bits (Imaginary: Cyber)

Mitsunobu Koshiba, President and CEO, JSR 

概要:

このトークでは、現在のAI技術のテクニカルな問題と経済的問題、すなわち計算コストがきわめて高いこととノイマン型コンピュータではエネルギー消費量が莫大であることに焦点を当てます。今、この2つの問題を克服するために、量子コンピュータや神経形態学的デバイスといった非ノイマン型コンピュータ技術を開発する多くの革新的なアプローチが実行されています。これらは私たちを「コグニティブ・コンピューティング」の時代へと導くことでしょう。それがサイバースペースで起こっていることなのです。

 

並行して、破壊的イノベーションを目指した現実世界の技術も開発されています。このトークでは、現実世界における3Dプリンティング、5G、衛星通信技術といった破壊的技術についても紹介します。これらの技術は二進数の世界(サイバースペース)における革新を補完するものであり、それはおそらく私たちを次の産業革命に導いてくれるでしょう。

 

トークの最後に、サイバースペースについて多くの知識を持つ若いSciPyの聴衆の方々に、原子(リアル世界)にも注意を払っていただきたいという私の希望をお伝えしたいと思います。そうすれば、リアルな科学/技術とIT技術が素晴らしい融合を遂げ、人類の新しい未来が生み出されるにちがいないのです。

日本語で表示

Re-run, Repeat, Reproduce, Reuse, Replicate: Transforming Code into Scientific Contributions

Fabien Benureau, Okinawa IST

Nicolas Rougier, INRIA

Pythonで実行される小さなランダムウォークの例がどのように進行していくかを見ながら、科学コードにつきまといがちないくつかの問題について説明します。コードに誤りがなく、その質が高くても、科学的知見への寄与を減少させる問題がある場合があります。私たちは、こうした問題を明確にするために、科学的発表の有益な一部となるためにコードが備えているべき5つの特徴を示します。それは再実行(リラン)、リピート(繰り返し)、再現(リプロデュース)、再利用(リユース)、複製(リプリケート)が可能であるということです。

通訳サービスが提供されます。

TFX: Production ML Pipelines with TensorFlow

Robert Crowe,Google

 

機械学習と深層学習アプリケーションの教育、デプロイ、維持管理のために機械学習プロダクションパイプラインを作り上げるのは、単なるモデルの教育にとどまりません。プロダクション機械学習パイプラインの開発に長年の経験を持つGoogleは、社内で使用しているツールやライブラリのオープンソース・バージョンであるTensorFlow Extended(TFX)をオープンソースコミュニティに提供してきました。

通訳サービスが提供されます。

Evolution of the Enthought Platform

Mark Dickinson, Enthought/Python Core Developer

略歴:MarkはPythonの開発チームの中心メンバーの1人であり、Pythonの数字コードを専門としています。これまでにミシガン大学、ピッツバーグ大学、アイルランド国立大学ゴールウェイ校で教育と研究に携わってきました。ハーバード大学で純粋数学の博士号、ケンブリッジ大学で純粋数学と応用数学の学士号を取得しています.

通訳サービスが提供されます。

プログラミング経験のない熟練科学者からPythonユーザーへの発展

Takayuki Miki,東京工業大学

SEM image noise reduction

Shinji Kobayashi,Tokyo Electron Kyushu LTD

daskperiment: 機械学習実験の再現性の担保

Masaaki Horikoshi, ARISE Analytics

機械学習を含むデータ分析では多くの試行錯誤が必要です。その結果はハイパーパラメータ、コード、パッケージなどに依存するため、過去の結果を再現できない場合があります。

 

このトークでは機械学習の実験を再現可能にするために必要なことと、そのためのツールをご紹介します。コアとなるツールである 'daskperiment' は機械学習アルゴリズムやパッケージに関わらず直感的に利用でき、必要な情報をトラッキングします。また、内部的にはDaskの仕組みを用いて、実験のステップを効率的に実行します。ユーザはこのパッケージを持ちいて、自身の実験を再現可能にすることができます。

SEM画像のノイズ除去方法について

日本語で表示

Next-Level Art: Becoming More Creative with AI 

Max Frenzel, Qosmo

ここ数年、AIの開発が驚異的に進歩しています。それは芸術や創造性など、多くの人がきわめて人間的だとみなす分野にさえ影響を及ぼさざるを得ません。多くの人々はAIが人間に取って代わるのではないかと恐れるか、あるいはAIは決して創造的になることはできず、AIが生み出したものはその定義からして芸術とはいえないと主張しています。しかし、私はそれに代わる見方を示したいと思います。進歩したAIは、人間を真に人間たらしめていることに人類が集中するのを可能にするでしょう。私たちが創造的探求を行うための新しいツールを人類に与えてくれるのです。私は音響デザインのために深層学習を用いる実験、NeuralFunkについてお話しします。NueralFunkはニューラルネットワークによって合成されたサンプルだけで作られた実験的な曲です。これはAIが作った音楽ではなく、創造的表現の新しい方法を探求するツールとしてAIを使用した音楽なのです。

通訳サービスが提供されます。

ネットワーク分析で見るPythonの世界 〜 PEPの参照関係をNetworkXで俯瞰する

Let's Enjoy the Python World Using Network Analysis ~ Overlooking the reference relationship of PEPs with NetworkX

Tomoko Furuki

本トークでは、Pythonの重要な技術ドキュメントであるPEP (Python Enhancement Proposals) 同士の参照関係を、ネットワーク分析のライブラリであるNetworkXを使って得られた発見について紹介します。 

 

ネットワーク分析とは、SNSの友達関係や論文の引用関係など、「何か」と「何か」の関係構造を探るために使われる手法です。この手法を使うと、個々の要素だけではなく関係を見ることで、新しい気づきが得られます。Pythonユーザであれば、NetworkXを使うことでネットワーク分析に入門できます。

 

また本トークでは、PEPの参照関係をインタラクティブに可視化したWebページについても紹介します (https://github.com/komo-fr/pep_map_site)。

日本語で表示

RAPIDS: GPU Accelerated Data Science

Akira Naruse,NVIDIA

 

RAPIDSは、データ科学者がデータを探求し、機械学習アルゴリズムの教育を行い、主としてGPUメモリの中にとどまりながらアプリケーションを作成することを可能にする桁外れに速く、使いやすいオープンソースのプラットフォームを構築することを目指しています。私たちの目標は、RAPIDSを使用してGPU上にタスクを維持することにより、データ科学者がハードウェアの最適化からランタイムのスピードアップを、またグルーコードの排除から生産性のスピードアップを実現できるようにすることです。このトークでは、現在のライブラリの状況、それを使ってこれまでに何がなされてきたか、これからどこへ向かうのか、いかにしてその使用を開始すればいいのか、そしてGPUの加速された動きにみなさんがどのように貢献できるかについてお話しします。

日本語で表示

CuPy: A NumPy-compatible Library for High Performance Computing with GPU

Masayuki Takagi,Preferred Networks

 

CuPyは、NumPy互換APIを持ち、Nvidia GPUの活用によってN次元のアレイ計算のパフォーマンスを高めるオープンソースのライブラリです。そのAPIは高いNumPy互換性を持つように設計されますから、ほとんどの場合、自分のコードをそれに置き換えるだけでスピードを数倍アップさせることができます。意欲的に開発され、常に適切に維持されているCuPyは、2,700以上のGitHubスターと13,000以上のコミットを獲得しています。CuPyはPyCon 2018でも発表されました。

通訳サービスが提供されます。

Reproducibility and Deployment of Scientific Code: A Discussion about the SciPy Stack and how edm Helps

Didrik Pinte,Enthought


 

略歴:Didrikは人工知能、データ管理、ソフトウェア開発の専門家です。自分の会社を経営し、環境セクターにおいてデータ管理のソリューションを提供することによって、リーダーシップ力を磨いてきました。以前には、ベルギーのルーヴァン・カトリック大学(UCL)で研究アシスタントを務め、Pythonベースの統合水資源管理アプリケーションを開発しました。オープンソースソフトウェア開発の提唱者であるDidrikはNumFocusの理事会メンバーであり、EuroSciPyの主催者、発表者でもあります。UCLで農業工学の修士号と経営学の修士号を取得しています。

通訳サービスが提供されます。

Scaling your Python Interactive Applications with Jupyter

Luciano Resende, IBM CODAIT/Jupyter Contributor

Jupyter Notebooksは、科学的問題や機械学習の問題に取り組む科学者やエンジニアがPythonインタラクティブなアプリケーションを構築するために使用する「事実上の」標準になっています。しかし、ビッグデータ分析が盛んになり、複雑な深層学習の作業負荷が大きくなっていることから、並列するコンピュータ群全体にまたがって計算を拡張する必要性が強まっています。このトークでは、Apache SparkやKubernetesを含む異なるタイプの計算クラスターにわたってインタラクティブな機械学習と深層学習の作業負荷を編成・分配するために、Jupyter Notebookのコンポーネントを使用する方法について説明します。このトークは、分散型プラットフォームに関心のある出席者、ならびにそれぞれの科学的な作業負荷を複数のマシンにスケーリングするのに苦労している科学者の方々を対象としています。

 

略歴:Luciano ResendeはIBM CODAIT(元Spark Technology Center)のSTSM・オープンソースデータ科学/AIプラットフォームの設計者です。10年以上にわたりASF(アパッチソフトウェア財団)でオープンソースに寄与してきたResendeは、ASFのメンバーであり、現在はApache Sparkエコシステムを中心とする多様なビッグデータ関連のApacheプロジェクトに貢献しています。目下取り組んでいるのは、スケーリング可能で安全かつ柔軟なEnterprise Data Scienceプラットフォームの構築に取り組むJupyterエコシステム・プロジェクトです。

通訳サービスが提供されます。

Apache Arrow - A Cross-language Development Platform for In-memory Data

Kouhei Sutou,ClearCode Inc.

 

Apache Arrowはデータ処理システムの目玉です。このトークでは、SparkやPySparkといったデータ処理システムにおけるデータ共有経費の問題の解決方法について説明します。また、Apache Arrowによって大きなデータの計算を加速させる方法についてもお話しします。

日本語で表示

Chainer: A Deep Learning Framework for Fast Research and Applications

Crissman Loomis, Preferred Networks

Chainerは高性能の実験やアプリケーションに用いる柔軟かつ直感的コーディングのため の深層学習フレームワークです。これは、自動微分されたニューラルネットワークの Pythonプログラミングを行うDefine-by-Runパラダイムを用いて、試行錯誤のスピードを 最大化するように設計されています。このフレームワークは分散環境における複数のGPU やアドオン・パッケージの間ですばやく特定の領域に飛ぶことを可能にしますから、パフ ォーマンスを加速することができます。このトークでは、ChainerのAPIの概要、深層学習 の研究・応用を加速する能力、及び将来のフレームワーク開発の方向性についてお話しし
ます。

通訳サービスが提供されます。

Optuna: A Define-by-Run Hyperparameter Optimization Framework

Takuya Akiba, Shotaro Sano, Toshihiko Yanase, Takeru Ohta and Masanori Koyama, Preferred Networks

このトークでは、新しい設計基準を持つ次世代のハイパーパラメータ最適化フレームワーク、Optunaを紹介します。新しい設計基準とは、(1)ユーザーが動的、入れ子式または条件付きの検索スペースを簡潔に作ることを可能にするdefine-by-run型のAPIであること、(2)サンプリングとアーリーストッピングを効率的に実行するものであること、(3)設定が容易であり、スケーラブルな分散コンピューティングからローカルなノートパソコンで実行される小規模な実験まで幅広い目的に利用できることです。当社のソフトウェアはMITライセンスで利用できます(https://github.com/pfnet/optuna/)。

通訳サービスが提供されます。

チュートリアル

Advanced Machine Learning

Alexandre Chabot-Leclerc, Enthought

 

Scikit-learnは、Pythonの強力な機械学習ライブラリです。 この3.5時間のチュートリアルでは、パイプライン、グリッド検索、再現性のある分析を行うための交差検定など、ライブラリの高度なトピックについて説明します。 また、計算時間を短縮し、過剰適合を防ぐための特徴選択についても説明します。 最後に、テキストデータを処理するためにscikit-learnのbuilt-in機能を使用します。

通訳サービスが提供されます。

 

前提条件:このチュートリアルはscikit-learn APIの経験があることを前提としています。 チュートリアルの最初に全員が同じ認識であることを確認します。 また、参加者がNumPy、Pandas、およびmatplotlibを使用できることを前提としています。 Seabornの知識も役立ちますが、必須ではありません。

略歴:Alexandre Chabot-LeclercはEnthoughtでPythonの教育と開発を行っています。デンマーク工科大学で電気工学の博士号を取得しました。卒業研究は聴覚研究の分野であり、人間の音声認識モデルを開発しました。関心を持っているのは、教えること、音響心理学、ロッククライミングです。

Advanced NumPy 

Juan Nunez-Iglesias, Monash University

 

ブロードキャスティングの規則、ストライド/ストライドトリック、高度なインデックス化について指導する実践的なチュートリアルです。

このチュートリアルは英語で行われます。通訳サービスが提供されます。

 

参加資格:Pythonのシンタックスになじんでいること、及びNumPy/アレイ計算をある程度理解していること

 

略歴:Juan Nunez-Iglesiasはオーストラリア、メルボルンのモナシュ大学の研究フェロー兼CZIイメージングソフトウェア・フェローです。scikit-imageの中心的開発者であり、SciPy、EuroSciPy、G-Nodeサマースクール、その他のワークショップで科学分野におけるPython利用について教えてきました。O'Reillyから出版されている"Elegant SciPy"(邦題『エレガントなSciPy』)の共著者です。

Tensorflow

Josh Gordon,Google

 

TensorFlow 2.0の実践的な手引きです。この3.5時間のチュートリアルでは、TensorFlowについて簡単に紹介した後、ニューラルネットワークの研修に入ります。このチュートリアルの対象はTensorFlowや深層学習の初心者です。目標は、出席者が効率的、効果的に学習を開始し、自分で学習を継続できるようにすることです。出席者は、インターネットに接続できるノートパソコンを持参していただく必要があります。事前にインストールすべきものはありません。

参加資格:機械学習の経験は前提とされていません。必要に応じて、関連する概念を紹介していきます。このチュートリアルの目標は、知る必要のあることをすべて教えることではなく、出席者がまず学習を開始し、最初の壁を乗り越え、自分で学習を継続できるようにすることです。

 

このチュートリアルは英語で行われます。通訳サービスが提供されます。

 

略歴:Josh GordonはGoogleのTensorFlowチームで働いているのに加え、コロンビア大学で応用深層学習について教えています。これまで10年以上にわたる機械学習の経験を持っています。ツイッターもご参照ください(https://twitter.com/random_forests)。

Intro to Visualization

Manabu Terada,PythonED

SciPy Japan 初心者向けチュートリアル (SciPy Japan Beginner Tutorial)

- 概要

  - データ分析や機械学習または科学技術計算をPythonを用いて実行したいという方が増えていると思います。これらを行う時に、ExcelやR、MATLABを使っているという方も多いと思います。

  - このチュートリアルでは、Jupyter Notebookを使い可視化を行う流れを体験して頂き、Pythonで実装する流れをつかんでもらいます。

- ターゲット

  - Python初心者

  - Pythonでデータ分析や機械学習または科学技術計算をやりたい

- 説明しないこと(理解している前提とする)

  - データ分析の目的

  - 可視化とは何か

- ゴール

  - Pythonの基礎を知る

  - Pythonでデータ始められるようになる

  - Pythonで可視化の方法を知る